アクセスログの収集そのものを自前でやり、そのログの分析ツールを作ってみると、結構色んなことが分かるものです。
自分でツールを作るわけだから集計ルールそのものを自分で全て設定できるのは当然で、その値が何を示しているのか明確であり、そもそも何が知りたいから集計するのかという理由も明確。何よりも収集されたログがどのようなものなのか全て分かっているため「正しい値」を求めてみる気になる。
分析ツールを作りながら、ふと「リピート率」というものが気になった。
ユニーク訪問者数(ユニーク・オーディエンス数)の定義が曖昧になっては意味が無いので、まずはそれから。
日々の訪問者のうち重複するものを取り除いたものを「日別ユニーク訪問者数」(仮)。
分析対象期間の「日別ユニーク訪問者数」を合算したものを「累計ユニーク訪問者数」(仮)。
そして分析対象期間内の訪問者のうち重複するものを取り除いたものを「ユニーク訪問者数」。
同一日内に複数回訪問した場合の集計項目として「訪問回数」というものがあるが、セッション管理がされていない仕組みの場合は“複数回”の定義が曖昧になってしまうため、「訪問回数」は無視することにする。
ということで基本的な管理項目は「一日の訪問者数」である。
仮に集計期間の初日に「10人」が訪問してくれて、その人たちが毎日欠かさずに10日間訪問してくれて、その10名以外誰も訪れなかったとしたら(そんなことはないだろうが)、「日別ユニーク訪問者数」は全て「10」で、「累計ユニーク訪問者数」は「100」。そして「ユニーク訪問者数」は「10」である。
以上を前提に「リピート率」の定義をしようかと思ったのが、「何のリピート? 人なの?訪問なの?」という疑問が浮かんだ。
矛盾がない集計ルールとするためにはどうすべきか同僚を交えて考えてみたところ、“訪問”を表す「リピート率」と“人”を表す「リピーター率」の二種類用意することでまとまる。(名称はあくまでも仮である)
「ユニーク訪問者数」をUO1、「累計ユニーク訪問者数」をUO2、訪問回数が1回のみの訪問者(一見さん)数をUO3とした場合、次のようになる。(この場合の「一見さん」は「一日しか訪問していない人」を示す)
「リピート率」= ( UO2 – UO1 ) / UO2 、 「リピーター率」= ( UO1 – UO3 ) / UO1
例えば、UO1が70、UO2が100、UO3が60の場合は、「リピート率」が30%で「リピーター率」が約14%となる。
とここまでやってみて、またもや気になるキーワードが浮かぶ。
「パレートの法則(20対80の法則)」
もしかしたらWebサイト(特に個人サイトの場合は)にも「パレートの法則」が当てはまるのではないのか。
いや、当てはまるサイトが訪問者に支持され、価値あるサイトとして長期間の存続が可能な(存続の意義がある)サイトではないのか。
アクセスログの集計値がどのようなパターンならば「パレートの法則」に当てはまるのか…
ある期間の「ユニーク訪問者数」が100、「累計ユニーク訪問者数」が450、そして一見さんを80とした場合…
一見さんの人数は80でアクセス数は80、常連さんの人数は20でアクセス数は370となり、「20%の常連さんが約82%のアクセス数を稼いでいる」ということになる。
SEO頼みの戦略を取っている限り「逆パレートの法則」のような「ロングテール」にマッチするようなサイトになってしまうため、一時的な集客は見込めて長続きは難しいかも。
ということで、ある程度の集客が可能になったら次のステップである「常連さん作り」を目指すべきだろう。
ただ、SEOなんていうものが無い時代は常連さんに支えられてサイトは育ったものだが、いつから「一見さん頼りのサイト作り&運営」が当たり前なものになってしまったのであろうか。
……………
φ(..)メモメモ
Noongoro.main.jp : PHPの正規表現のpreg_match()関数