2009/03/24

TechCrunchさん、米国のデータは世界を代表しません

2009/3/20のTechCruchの記事から。

主旨としては、Hitwiseのデータ(別の自分の投稿でも掲載したチャートだ)と、Google Trendsのデータの乖離がひどくて、Hitwiseは話に並んだろうという批判記事。Quantcast, Comscore, Hitwise, Compete, Alexaどれも何らか問題があるというのが前提にあって、その一例としてあげているようだ。

しかしそもそも比較したものが、Hitwiseは米国データなのに対して、掲載したGoogle Trendsは世界のデータだ。米国に限ったものは一番下のグラフで、まあいい線いっている(といってもいろいろ言いたいことはあるけど)感じがするけど。もちろん、所詮サンプリングしたデータだったり、量が多くても偏っているデータだったりする訳だけど、比較するものが違データを批判するのは、調査リテラシー以前の問題かと。

例えばこの例でいうと、FacebookとMySpaceは世界各国でシェアが全然違っていたりするので、当然検索語もそれに近い分布をしているはず。となれば、米国データは米国データと比較しないと意味がないのは当然。同じチャートで私が関心を寄せて以前の投稿で指摘したのは、どの検索語も同じ時期に倍くらいにピークを上げた不自然さ。データのおかしさをいうなら、こちらの方も指摘して欲しかった。まあこれの真の原因はわかりませんが。

それより感心したのは、その記事に対するコメントが数多く寄せられ、私と同じ指摘をしているのが散見されたが、むしろ色んな議論に発展して意見を言い合っているのは、さすが米国だと思う。Hitwiseのデータのサンプルについてや、Google Trendsのデータの見方についてとか。日本ではこうはならないけど、面白い素材が提供されたら、積極的に発言することが、結局自分のためにもなるんだけどなあ。。。
ちなみに1番目と2-3番目のグラフは時系列のスケールが全然違うので、そちらのトリックにも惑わされないように。






0 件のコメント: