各社とも非常に大雑把な情報しか公開していないので、これで判断はなかなかできない。Nielsen//NetRatings、comScore MediaMetrixは基本的に調査パネルからのデータ、HitwiseはISPのトラフィックデータ、Alexaはツールバー、Compete.comはそれらのミックスのようだ。
そもそもサンプリングで各手法をミックスすることが私には理解できない。いくら後で全体をネット人口の属性分布にウェイトを掛けて調整したりするような手法をとったとしても、違うソースのデータを混ぜる感覚はわからない。 ある程度の数が揃わないことの言い訳をしているようにしか思えない。そもそも偏っているサンプリングなので、どう混ぜても構わないという論理なのかもしれないが、なるべく偏りを少なくして、統計的誤差は計算可能にしようという努力はないのだろうか。勿論偏りを少なくすれば、コストが高くなるのは間違いないが、安かろう悪かろうをユーザにきちんと説明しているとは思えない。
下表でOpt-in Panelsとあるうち2社の調査パネルの集め方をみてみる。Nielsen//NetRatingsがRDD(Randam Digit Dialing---電話番号をランダムに発生させる方法)、comScore MediaMetrixは様々なランダムリクルートと書いてあるだけで詳細は明らかにしていない。comScore MediaMetrixは、セキュリティソフトやくじなどのインセンティブなど与えているなど、本質的でない話が載っていて、逆に特殊なインセンティブで偏ったユーザを集めているような悪い印象を与えかねないように感じた。
HitwiseのISPのトラフィックデータというのは、一体どこのISPからデータを集めているのだろう。そしてそれは果たして、米各地域や米国外への中継ポイントなどのトラフィックを均質的に捉えられるようなものなのか私にはわからない。Alexaについてはサイト競合比較にAlexaを使っていけない理由やAlexaの問題点を参考にして欲しい。
それぞれの調査手法に関係するページのリンクは以下の通りだ。私の拙い英語力に間違いがあるといけないので、詳細は確認して欲しい。
http://www.netratings.com/solutions.jsp?section=sol_1&nav=1
0 件のコメント:
コメントを投稿