2012/01/10

継続性のないデータをトレンドデータとして繋いではいけない  [週刊IFWA 2011/11/28]

定期メルマガの巻頭コラムのアーカイブです。メルマガの登録はこちら↓からどうぞ。
http://ibukuro.blogspot.com/2010/07/blog-post_12.html


■ 継続性のないデータをトレンドデータとして繋いではいけない


久々にデータに関わる騒動がありました。短い時間でしたが Yahoo!Japanのトピックスでも「mixi「ユーザー激減」に反論」と題して掲載されていました。


詳細は説明しないので、検索などで全貌は掴んで頂きたいのですが、簡単に言うと、月次でリリースされる調査会社のデータをグラフにして毎月ブログに載せている著名な方の投稿がきっかけです。


その月の更新データでは、あるサイトの利用者数の集計方法の定義が変わりました。投稿の中では、それについても詳細に補足説明がなされているのですが、折れ線グラフは過去データと継続性があるように実線で結ばれていました。


悪いことに、定義変更でそのサイトの利用者数は、過去の定義での集計数字と比較すると結構落ち込んでいました。その数字の見掛け上の下落を受けてか、「そのサイト終った」的な、そのサイトやサービスに対する批判のような、本質から外れた書きこみも増えました。


今回その対象になったサイトが大手のメディアサイトだったため、その投稿から派生してネット上を流れはじめたクチコミが、メディア、広告系の多くの人の目に留まった可能性があります。そのブログ自体もソーシャル系で著名な方なので影響は大きかったでしょう。


今回のような場合に、過去データも含めてどのようなグラフを書いたら良いかということですが、自分で昔書いたブログの記事をご参考になって頂ければと思います。
http://ibukuro.blogspot.com/2010/02/blog-post_22.html


これは電通が毎年発表する日本の広告費の媒体別の統計ですが、途中の年から定義変更があり、2005年を境にインターネット広告の経年比較ができなくなったのですが、そこだけ点線にして、さらにグラフ中にも、「基準変更のため前後で単純比較できません」的な記述を付けました。


もちろんこれで完璧だという積りはありません。二つ目のグラフは棒グラフですが、注意書きはしているものの、グラフでの表現を諦めています。


今回の件は何かきっかけがあったら、それをキャッチーな話題にする、単なる悪口を書きこむ機会にしてしまうといった周辺の人の行為が問題だと思いますが、自分が作ったデータやグラフが、別の悪意をもった意見のきっかけにされる隙を少なくする注意は必要だと感じました。


逆に言えば、私が毎日のようにTwitterで呟いていることですが、意図を持って数字やグラフを作るという方法もあります。でもそれはなるべく社内でお使い頂ければと思います。数字やグラフは一人歩きするのですから。

0 件のコメント: