2007/10/16

平均の罠2(1日平均)

今回は1日平均に関して考えてみる。

ある記事で気になったコメントだが、「外れ値を除いて平均値を出す」といった事が書かれていた。アクセス解析は、サンプル調査ではなく、全てがありのままの数字なので、外れ値という考え方はあるのだろうか。サンプル調査でたまたま年収で1億の人がいたら、平均年収の数字をかなり上げてしまうため、この人の年収は平均の算出から外す、つまり外れ値は集計から外すというのが、サンプル調査に於ける外れ値の扱い方だ。


またロボットなどからのアクセスが外れ値の一例として挙げられていたが、ロボットなどでのアクセス排除は、アクセス解析に於いては初期設定の問題であって、出てきた結果の集計処理の問題ではない。もちろん全てのロボットが排除できないこともあるので、事後的にそういうものを排除しなければならないケースはあると思うが、これは外れ値ではなく、もともと排除すべきデータであり、質の違う議論をしてしまっている。

しかしそれは除いても、例えばメールなどで月1回の大アクセスがあった時に、これを外れ値として外して集計する人がいるだろうか?ECサイトなどで下図のようなアクセスを多々見てきたが、外れ値として集計から外す意味はない。

では、唯一平均値を使って意味がありそうなケースをご紹介しよう。こちらは平日と休日に分けて、1日平均の訪問回数などの指標を平均値として使うという場合で、しかもあまり変動のないイントラネットとか、ユーザサポートなど固定客しか閲覧しないような動きの少ないサイトで有効だ。最下図のようなケースだ。

また分析指標としては使わないが、平均値を算出することは筆者もしている。しかしこの利用目的は、対前月比などでの重要指標としては一切活用しない。数字の羅列になっている数表などを細かく追っていく時に、アクセスが増大した日の数値が、平均値の2倍なのか5倍なのかといったものを、ぱっと見て直感的に把握するためのツール的使い方である。

ということで、今日の結論は、「日別のアクセスは平均を見て済まさないで、毎日の動きをきちんと見よう」ということ。ここではいきなり、森を見ないで木を見るような見方に思われるかもしれないが、当然月次データの見方は森を見てから、木を見るような見方をする。その具体的なやり方は別途ご紹介しよう。






























関連リンク:

直帰率が低いと、コンバージョンは高くなるか
アクセス解析の直帰率、米サイトタイプ別平均値は?
リンクでしか辿れないページの直帰率が0でない理由は
アクセス解析における月次トレンド・データの見方
米ウェブページ1ページ平均の閲覧時間は55秒
メールでの問い合わせに対する平均反応時間は19時間31分
アクセス解析における「ヒット数」「インプレッション数」とは、WAAの定義集から
アクセス解析における「コンバージョン率」とは、WAAの定義集から
アクセス解析における「コンバージョン(数)」とは、WAAの定義集から
アクセス解析における「一訪問あたりのページビュー数」とは、WAAの定義集から
アクセス解析における「直帰数」「直帰率」とは、WAAの定義集から
アクセス解析における「ページ離脱率」とは、WAAの定義集から
アクセス解析における「一人あたりの訪問回数」とは、WAAの定義集から
アクセス解析における「リーセンシー」「フリークエンシー」とは、WAAの定義集から
アクセス解析における「リピート訪問者数」とは、WAAの定義集から
アクセス解析における「再訪問者数」とは、WAAの定義集から
アクセス解析における「新規訪問者数」とは、WAAの定義集から
アクセス解析における「クリック数」「クリック率」とは、WAAの定義集から
アクセス解析における「ページ参照元、セッション参照元、訪問者の参照元」とは、WAAの定義集から
アクセス解析における「参照元」とは、WAAの定義集から
アクセス解析における「セッション滞在時間」とは、WAAの定義集から
アクセス解析における「入口ページ」「ランディング・ページ」「出口ページ」とは、WAAの定義集から
アクセス解析における「ユニーク・ビジター数」とは、WAAの定義集から
アクセス解析における「セッション数」とは、WAAの定義集から
アクセス解析における「ページビュー数」とは、WAAの定義集から
アクセス解析における「ページ」とは、WAAの定義集から
サイトタイプ別、プロセス別KPI
ユニークビジター数にこだわるな、参照元別直帰率
アクセス解析で直帰率の平均は意味がない
ページビューはあい変らず最重要指標の一つ
平均の罠2(1日平均)
平均値の罠1
4象限グラフの罠
アクセス解析では偏差値は使わない方がよい

0 件のコメント: