2009/01/08

アクセス解析における月次トレンド・データの見方

1月から3月までの毎日のアクセス(PV数、ユニーク・ユーザ数、セッション数のいずれもとしておこう)水準が同じだとした場合、月次データのPV,UU,セッション数は同じになるだろうか?

さて答えは次のうちのどれが近いと思うか?
A.まあ大体同じになるはずでしょう、そりゃ
B.正月はアクセスが少ないから、1月が少なくて、2-3月は同じくらいじゃないの
C.2月だけUUが少し、PVとセッションは1割減くらいじゃないの

以下の答えを読む前に、正解とその理由をまず考えておこう。



まず、毎日のアクセス水準が同じと言っているんだから、「正月のアクセスが少ない」という勝手な条件変更はだめですから、Bはダメ。

一度失敗をしている人は二度とこの単純な話を忘れることはないのだが、日数の変動が2月前後は極端になるために、アクセス状況に変化がないのに、月次でまとめると変動がおこっているように思えることに注意しなければいけない。

くどいようだが一応解説すると、1月が31日、2月が28日、3月が31日で、毎日のアクセス水準が同じであれば(まあ世の中そんな単純なことは滅多にないので、現実は当然こんなことはおこらない)、2月の対前月比は約1割減(1-28/31=0.097)、3月の対前月比は約1割増(31/28-1=0.107)となる。

ただし、これが当てはまるのは、日別データの積上げが月次データに一致すべき指標のみなので、ページビューとセッションだけがあてはまる。セッションは厳密には、日を跨ぐセッションをどう集計するかなどで少し食い違いは出てきたりするだろうが。

ユニークユーザ数は、月次で全くリピートユーザがいないなら別だけど、まあ普通は何回同じ人が来ることもあるだろうから、日別のUU数の合計は月次のUU数より多くなる。なので日数が1割少なくても、月次データへの影響はそれより少なくなる。

ということで、この条件下で相応しい答えはCとなる。

当然現実は正月休みのアクセスは非常に下がるし、1月-3月の休みの日数も年によって違うし、サイトでやってるキャンペーンやイベント、その他外部要因が絡んで、話は単純ではないが、逆に話が単純でないだけに、意外と忘れ去られる要因の一つでもあるということ。大抵の人は知っている(あるいは知っている積り)ことなんだけど、何の疑問も持たずに「2月に1割減で不調です」なんて書いているレポートも多分あるのではないか。

あとはお解かりのとおりで、大抵の月は30日、31日とが交互に来るので、3%程度の上下動は統計的有意でもなんでもない、単なる日数の違いによる変動の範囲ということになる。

こういうときにこそ、月次データの対前月比比較の時は、1日平均のPV数とかの指標が活躍する時な訳だ。次はこの1日平均とか、週次データの見方とか、いろいろ話しが展開できるのだが、それは別の機会にする。

0 件のコメント: