2009/11/26

アクセス解析ツールのいけてない集計仕様ベスト3、第1位

さて第1位に輝いたのは、Google Analyticsの参照元関連の集計仕様だ。とは言っても、 仕様が明確でないので、100%確信を持てていない。知っている方は是非正確な情報を教えて欲しいという意味も込めて投稿した。(2009/12/11追記:この認識で正しそうだということが現時点では判明しております。)

普通のアクセス解析ツールの参照元のレポートは、「参照元 情報(referrer)」に基づいて、セッション参照元(セッション・レベルの場合)かページ参照元(ページ・レベルの場合)をレポートすると思うのだが、Google Analyticsではそうではないようだ。


Google Analyticsのトラフィック系のレポートで使われているデータは、6ヶ月間有効な__utmz cookieに基づいている。このcookieは、参照元なしのセッションでは上書きされず、参照元が存在したセッションでは新しい「参照元情報」が上書きされる。従って、1回目に検索エンジンから流入し、2回目にブックマーク(参照元なし)で流入した場合に、2回目のセッションが対象となる集計データに おいて、参照元は「セッション参照元である、「参照元なし」」とはならず、cookieに記録されている「1回目のセッションの参照元である、「検索エン ジン」」となる。

キーワードのレポートなども同様で、上記の例では2回目の流入は参照元なしにも関わらず、「cookie」に記録されていた1回目の検索エンジンで利用したキーワードが2回目の流入セッションの「キーワード」としてレポートされる。

これはWAA(Web Analytics Association)が定義している、オリジナルリファラー(サイト訪問者の一番最初のサイト訪問時の参照元のこと)とも異なる。一番直近で参照元が判別できた(参照元なし以外)参照元ということで、広告効果測定系の言葉で言えば、該当セッションに加えて直近の間接効果も含めた効果とでも言えよう。

もちろんこれも、単純に間違いだと断定すべきものではないが、普通の文脈に於ける「参照元」は、セッションベースであれば、セッション参照元と解釈するのが自然だ。ほとんどの人はこれを正確に理解できているとは思えず、これもミスリードする集計仕様と言えよう。しかも大量の初心者も利用していることを考えれば、これも黒に近い灰色クラスの集計仕様といっても過言ではあるまい。

もちろんGoogleでは、この仕様を隠しているわけではなく、公表しているようだが、これを正しく理解できるリテラシーを持ち合わせた人がユーザの1%もいるだろうか。JavaScriptやcookieの意味は公開しても、それをレポートでどう集計表示しているというところが明示されていないようなので、これではよくわからない。http://code.google.com/intl/ja/apis/analytics/docs/concepts/gaConceptsCookies.html

<2011/6/28追記>
こういった難しい仕様をまとめた電子書籍を出しましたので、こちら↓からご覧ください。

「おしえて! Google Analytics」を発行します

関連リンク:
アクセス解析ツールのいけてない集計仕様ベスト3、第2位
アクセス解析ツールのいけてない集計仕様ベスト3、第3位
アクセス解析ツールのいけてない集計仕様、番外編

0 件のコメント: