2009/05/01

別のアクセス解析ツールでアクセス数が違う理由

最近いろいろなブログでアメブロのアクセス数が他のツールよりも相当多いという話が話題にになっているようだ。例えばこれ↓が、それに答えている投稿をしている。
http://www.jweb-seo.com/blog/wordpress/2009/04/30/629

アメブロを使っているわけでもないし、事実関係を確認したわけでもないので、一般論ということになるが、調査データって結局、何を集めてどう集計していて、言葉の定義をどう使って指標化しているかっちゅうことに尽きる。

各種論調を総合するに、アメブロさんはロボットなども含めた単純なログの集計をしているということなのかもしれない。であれば、例えばグーグル・アナリティクスの数字と比較するんであれば、一方はログで他方はビーコン式という手法なので、その違いによる特性を理解しないといけない。

中級者以上は耳にたこが出るくらい聞いている話だと思うが、サーバー側で計測しているのと、クライアント(JavaScriptでブラウザ)側で計測しているのでは、そもそも全く違うデータを集めているわけで、そうすると、以下のようなどちらが相対的にアクセスが増える/減るという関係がある。

<サーバ側計測が多くカウントするケース>
・フレームセットなど、ページの閲覧の見かけ上の水増しもカウントしている場合
・ロボットやスパイダー、ダウンロード・ツールのアクセスをカウントしている場合
・ユーザ側で完全に表示されていない場合もカウントされる(要求ベースを全てカウント)


<クライアント側計測が多くカウントするケース>
・プロキシ・サーバから配信された場合もカウント(サーバーまでリクエストがいかない)
・ブラウザ・キャッシュ(戻るボタンなど)を閲覧した場合もカウント(同上)


取得しているデータが違うことに加え、ブログサービスなどで表示される「アクセス数」って、そもそも「ページビュー数です」などとご丁寧に正確に説明してくれることは期待できないので、何を表しているかも実は危なかったりするわけ。これは言葉の定義の問題。

で、結局は出てきた数字をどう使うかという点だが、絶対値を絶対視しないということだろう。どのくらい好調に伸びているのか停滞しているのか、伸びたらその原因は何かという風に考えるのがよい。

2005年第4回アクセス解析カンファレンスで10程度のツールを同じサイトに適用して、数字を比較するという面白いイベントを実施したが、その結果を紹介しよう。

1ヶ月計測したのだが、簡単にまとめると以下のようなものになった。
・日別のユニークブラウザ数は、最大で倍程度の乖離があった
・日別のページビュー数は、一部を除き倍程度の乖離があった
・上記一部を除かないと100倍も違いがあったが、それはロボットのアクセスだった
・クライアント側の計測ツールではユニークブラウザ数もページビュー数も殆ど一致した
・全てのツールで、日別のトレンド(上下動の傾向)は一致していた(ロボットの驚異的なアクセスを除いて)

ということで、数字はトレンドで見ましょう。また安易にツールの乗換えを行うのは慎重にしましょう。なぜならトレンドが途切れてしまうから。クライアント側での計測ツール間の乗り換えなら、それほどトレンドに影響はないが、手法の違うものに乗り換えるなら、しばらくは平行期間をおくことが肝要ということになる。

0 件のコメント: