2009/10/29

2.データ収集方法の明示「アクセス解析の集計と用語定義ガイドライン」

ウェブサイトの利用状況データは、様々な手法によって取得することができる。以下は代表的なデータ収集手法だが、どのような手法によってデータを収集したかを明らかにすることで、収集方法の特性に応じた正しい解釈を促進することになる。利用したツール名まで明記する必要はないが、最低限下記のような分類レベルで明示するのが望ましい。

A.サーバーログを利用する方法

内容:ウェブサーバーの機能を使って収集されるサーバーログを利用するもの

特徴:ウェブサーバーへのリクエストが記録されるので、検索エンジンのクローラーなど、人のウェブサイトの閲覧行動以外も含めた全ての要求が記録される。そのため人の閲覧行動だけを集計したい場合は、それらのデータを除いて集計することが必要である。また戻るボタンによる閲覧など、キャッシュから読み込まれ、ウェブサーバーにリクエストがいかないクライアント側の閲覧行動は取得できない

注意:キャッシュからの読み込みデータは取得できないので、閲覧経路の正確な把握などで精度が低くなる可能性がある。また、ブラウザのユーザーエージェントを詐称するクローラーのデータが混在する可能性がある。

B.JavaScript を利用して、ブラウザ側の行動データを取得する方法

内容:JavaScript の計測タグを使って、ブラウザのデータを収集するもの

特徴:検索エンジンのクローラーなどは基本的にJavaScript を無視するため、人のブラウザによるウェブサイトの閲覧行動だけを取得することになる

注意:検索エンジンのクローラーなどの挙動を知りたい、といったニーズには応えられない。また、セキュリティその他の理由からブラウザでJavaScript の動作をオフにしているごく一部の閲覧者の行動は取得されない。

C.ウェブサイトの直前を流れるパケットデータの一部を取得する方法

内容:ウェブサーバーを出入りするパケットデータの一部を利用するもの

特徴:サーバーログと同様、サーバー側でのデータ取得に特有の特徴に加え、サーバーログでは記録されない、post メソッドによるリクエスト情報の収集も可能

注意:キャッシュからの読み込みデータは取得できないので、閲覧経路の正確な把握などで精度が低くなる可能性がある

D.外部サービスのデータを使う場合上記AからCまでとは区分のレベルが違うが、レンタルサーバーやブログサービスなどでサービス提供側から提供される数値が、上記などのどの手法によって取得されたデータなのか、自分のアクセスを含むものなのか排除されるものなのかなどについて明示するのが望ましい。

これ以外のデータ収集方法もある。その場合も上記のように、それはどのような方法なのかということ、それに伴ってデータを読む場合に気をつけなければいけない特徴や注意ということも明らかにすることが望ましい。

ウェブサイトのアクセスデータは、同じサイトのデータでも別の手法を使えば違う数字が出てくる。つまり大事なことは、どの数字が正しいということではなく、それぞれの特性が違うので、それを理解して使うということ。また取得可能なデータの精度も100%確実なものはない。しかしだからこそ、どういう方法で取得したデータなのかということを知り、そのデータの特性を理解して、その範囲の中で活用することが必要になる。例えば瞬間の絶対値を見るのではなくトレンドで数字を追うといった視点である。


関連リンク:

アクセス解析の集計と用語定義ガイドラインを発表
1.データ収集方法と集計方法、定義の重要性「アクセス解析の集計と用語定義ガイドライン」
2.データ収集方法の明示「アクセス解析の集計と用語定義ガイドライン」
主要指標の定義 「ページビュー」と「ページビュー数」(単位:ページ)「アクセス解析の集計と用語定義ガイドライン」
主要指標の定義 「訪問」と「のべ訪問者数」(単位:人もしくは回)「アクセス解析の集計と用語定義ガイドライン」
主要指標の定義 「ユニーク訪問者」と「ユニーク訪問者数」(単位:人)「アクセス解析の集計と用語定義ガイドライン」
主要指標の定義 「ページ滞在時間」と「訪問滞在時間」(単位:時分秒)「アクセス解析の集計と用語定義ガイドライン」
アクセス解析における「ヒット数」「インプレッション数」とは、WAAの定義集から
アクセス解析における「コンバージョン率」とは、WAAの定義集から
アクセス解析における「コンバージョン(数)」とは、WAAの定義集から
アクセス解析における「一訪問あたりのページビュー数」とは、WAAの定義集から
アクセス解析における「直帰数」「直帰率」とは、WAAの定義集から
アクセス解析における「ページ離脱率」とは、WAAの定義集から
アクセス解析における「一人あたりの訪問回数」とは、WAAの定義集から
アクセス解析における「リーセンシー」「フリークエンシー」とは、WAAの定義集から
アクセス解析における「リピート訪問者数」とは、WAAの定義集から
アクセス解析における「再訪問者数」とは、WAAの定義集から
アクセス解析における「新規訪問者数」とは、WAAの定義集から
アクセス解析における「クリック数」「クリック率」とは、WAAの定義集から
アクセス解析における「ページ参照元、セッション参照元、訪問者の参照元」とは、WAAの定義集から
アクセス解析における「参照元」とは、WAAの定義集から
アクセス解析における「セッション滞在時間」とは、WAAの定義集から
アクセス解析における「入口ページ」「ランディング・ページ」「出口ページ」とは、WAAの定義集から
アクセス解析における「ユニーク・ビジター数」とは、WAAの定義集から
アクセス解析における「セッション数」とは、WAAの定義集から
アクセス解析における「ページビュー数」とは、WAAの定義集から
アクセス解析における「ページ」とは、WAAの定義集から

0 件のコメント: