2011/04/26

アクセス解析などのデータ分析における13の原則

13の原則の内、すでにいろいろなところでご紹介しているものが7つありますが、改めてそれも含めてご紹介したいと思います。オリジナルのものもあれば、いろんな人が言っていることを言い換えたりしているだけのものもあります。

・3つのデータ分析視点 -T,B,S-
1.トレンドでデータを見る(Trends)
2.目標や基準すなわちベンチマークを持つ(Benchmark)
3.全体でみるのでなくセグメント化しブレークダウンしてから見る(Segmentation)


これはどのようなデータや数字でも汎用的に利用できる考え方です。経営分析などでも使えます。トレンドは季節変動などを含めた中長期の視点で数字を見ないと意味がないということです。単月で一喜一憂しても仕方ありません。季節変動、成長期なら増加の勢いや加速度という視点でも見ます。ベンチマークは他社比較、自社の予算実績管理などで基本となる考え方です。これがないとよい悪いの判断ができません。セグメント化は具体的に改善案などを考える時に、幾重にも因数分解しないと悪化要因が簡単に洗い出せないから必要な方法です。アクセス解析なら新規/リピータの軸とか集客施策別など幾らでも切り口があります。アンケート調査の結果なら属性別にクロス集計をして違いを明らかにしていく方法です。

・4つの対顧客戦略 -4S-
1.集客(流入)
2.接客(回遊)
3.成約(コンバージョン)
4.再訪(リテンション)


これは顧客の態度変容とサイトの動きをセットにした見方です。認知(Attention)→関心(Interest)→行動(Action)→深く関与(Engagement)という態度変容と、流入(Referrer)→ページ回遊→目標達成(Conversion)→再訪問になぞらえています。「再訪」は、いい言葉がなかったのですが、最近ではコマースデザインの坂本さんの「追客」という言葉がいいなあと感じています。その場合は4S(サ行で始まる4つのキーワード)ではなくなるのですが。

・3つのデータチェック点
1.サンプル(サンプル調査において、サンプルの大きさと回収率)
2.データ収集方法(調査手法、アクセス解析なら解析ツールのタイプ)
3.集計方法と指標の定義(どのような計算式で集計し、それを何と表現しているのか)


これらはデータの信頼性や数字を読む際の判断に大きく影響を与えます。私が最も気をつけている部分で、これが全ての土台になると思っています。

サンプルに関して言えば、サンプルサイズに応じて統計誤差が算出できます。1000のサンプルに対する調査でPC保有率が80%という結果が出た時の、統計誤差は±2.5%となります。つまり真実は77.5%~82.5%である可能性が95%であるなどと統計的に言えます。一方1000サンプルで100人しか回答者がいない調査は回収率が10%の調査といい、これを「偏り」といいます。関心のある人など、回答のパターンが偏っているということを示します。この回収率が低いと真実からの乖離が非常に高くなり、調査データの信頼性(真実からの乖離)は低くなります。よくある誤解としては、数が多ければよいというものですが、サンプルが少なくとも回収率が90%と高い調査の方が、回答の信頼性は高くなります。100万人の中国のデータを全世界のデータと言えないのと同じです。これが偏りです。

次のデータの収集方法ですが、当然何を収集しているのかということで、データは変わります。アンケート調査ならどういう質問文でどういう選択肢を用意しているのかで、回答パターンは変わってくるでしょう。アクセス解析なら、サーバログとJavaScriptビーコン型が取得するデータは大元から異なっているので、同じ集計をしても違う結果になるのは当たり前の話です。

最後の集計方法と指標の定義ですが、当たり前だと思っている指標でも、我々が想像するのと違う計算方法を行うなんてのは、普通に行われています。例えばアクセス解析の滞在時間で最後のページの閲覧時間は「不明」(通常次のページの閲覧開始時間との間隔で計算するため)ですが、0秒で計算に組み入れるツールもあれば、計算に組み入れないツールもあるわけです。こんな違いで何倍の差にもなり得ます。言葉(指標)の定義も、ツールによっては全然違う意味だったりすることもまだまだあるでしょう。

・データを組織へ浸透させるための2手法
1.金額で話をする
2.目標設定をする


マネジメント層と話をする際の共通言語は「金」だという点が一つ目です。どちらかと言えば、これは下から上を説得するための手法として活用すればよいと思います。こんなに売上や利益が増える、だからこういう施策に投資すべきということを説得するために、誰もがビジネスで共通言語として持っている「お金」で話をします。もう一つは目標設定することです。目標未達であれば、とにかく改善しなければならないという具体的な行動を促すことができます。普通の事業予算はそのような目的を持って作られます。ウェブサイトなどでも同じことです。目標がなければ、出てきた数字は「ふーん」で終わります。TBSのBとは似てますが、目的は全く異なります。

・解析の収穫逓減の法則
最初の解析で直帰率の改善やコンバージョンプロセスの改善などで劇的に改善を行う事が出来たとしても、同じパフォーマンスを維持していくことは難しいです。2回目、3回目の分析改善活動は、1回目より効果が減っていきます。解析も費用対効果を考えて取り組むことが重要です。

2 件のコメント:

藤本 さんのコメント...

いつも勉強させて頂き有難うございます。
下記、誤字ではないでしょうか。

×調査データの信頼性(真実からの乖離)は高く
○調査データ ~ (真実からの乖離)は低く

些細ではありますが、ご確認のほどよろしくお願い致します。

衣袋 宏美(いぶくろ ひろみ) さんのコメント...

本当ですね。真逆になっています。訂正させて頂きます。ご指摘ありがとうございました。衣袋