デジタルマーケティングに役立つ!統計入門【①基本編】

ビジネスにおいて最も大切なのは、できるだけ早く、できるだけ良いものになるよう意思決定することです。この時、データを活用することで意思決定の精度・スピードが高められることは周知の事実でしょう。

しかし、一口に「データを活用する」と言っても、それがうまくできていないところも多いのではないのでしょうか?単にデータを整理してふんわりと現状把握ができたね〜、綺麗なグラフができたけど何も読み取れないね〜、という「データ活用」はデータをうまく扱えたとは言い難いでしょう。

そこで全3回にわたり、データ分析の基本である「統計」について、ビジネスに活かすための基礎事項を解説した記事を公開いたします。初回である今回は統計が意思決定に使われるようになった理由などを扱います。

マーケティングに統計学が必須な理由とは?

統計学が軽視される理由の一つに、「経験則や理屈による意思決定の方がしっくりくる」というものがあります。

しかし、人間の感覚にしっくりくるからといって迅速で最良の選択肢であるとは限りません。

例えば、19世紀ロンドンでコレラが流行った時、当時の識者らは悪臭のひどい地域でコレラが流行していたことから清潔にするために消臭剤を撒くことが有効だと提案したり、汚物を川に流せるよう政策を実行したりしました。コレラが患者の汚物に潜んでおり水によって拡散された歴史を知っているからこそこうした策は無駄、ないしは逆効果だとわかりますが、それを知らなければ現代人とて似たような判断を下してもおかしくありません。

また、理屈や経験に基づく判断はしばしば先入観に誘導されてしまいます。「マーフィの法則」をご存知でしょうか?例えば、「遅刻しそうな時に限って、電車が遅延している」これを聞くと共感できる方も多いと思います。しかしこれは単に記憶の偏りによって植え付けられたものです。つまり、普通に乗っていて遅延した時と遅刻しそうなのに遅延した時とでは後者の記憶の方が残りやすかっただけということです。

したがって、データマーケティング・テクノロジーマーケティングでは主観的なマーケティングよりも正しいデータ分析によるエビデンスの発見が重要になってきます。
このデータ分析に役立つのが統計です。

統計学って結局何をしているの?

統計についてよく聞く意見には、「書店で統計の本を手に取っても〇〇分布だのと数式が羅列されているばかりで、何をやっているのかよく分からないから信用ならない」というものもあります。

しかし、ビジネスにおける統計学の思考フローは極めて単純で、

①それぞれの課題解決に向けた適切なKPIの設定

②データ収集・分析

③因果関係の洞察

の3ステップです。①は過去記事でも解説されているため割愛し、②と③について詳しく解説します。

データ収集・分析

データ収集方法は全数調査とサンプリング調査(標本調査)の二つです。前者はその名の通り全てのデータを集計し、それを分析することです。全数調査では全てのデータを取り扱うので間違いなく精度はある程度保証されますし、今は「ビッグデータ」という言葉が使われて久しいです。我々の肌感覚にもあっています。が、分析するデータの量が莫大で時間もコストもかかります。全数調査の具体例によく挙げられる国勢調査が5年に一度しか行われていないことからも明らかでしょう。

これに対し、サンプリング調査では全体のわずか数パーセント(もしくはそれ以下)をランダムに抽出し、そのデータを分析するというもの。身近なものでは、視聴率調査や選挙速報などがあります。調べる量が少ないのでコストも時間も全数調査より少なくて済みますが、こうした調査は正確と言えるのでしょうか。これは次項でご説明します。

いずれにせよ、デジタルマーケティングにおいては数字で表せる定量的なマーケティングが必要です。このデータの収集分析において、全数調査がコストなどの問題でできない時、統計学が効果を発揮します。

因果関係の洞察

先ほど出たサンプリング調査の信頼性に対する答えは「必ずしも正確ではないが、分析と現実が違う確率ははっきり伝えられる」です。

例えば日本に住んでいてパンが好きな人の割合を調べたい時、全人口から5%ランダムに選んだ人全員がパン好きだったとしても、残り全員がそうでない時を考えてみましょう。本当のパンが好きな人の割合は5%であるのに、この分析では100%パン好きということになってしまいます。

当然この分析は正しくないですが、肝心なのはこうしたことがどの程度起こりうるのか統計では述べることができるということです。つまり、現実と分析が異なっている可能性も統計学を使えば具体的な数値で表現できます

結局のところ誤差があっても意思決定に影響しない程度の誤差であれば問題ないのですから、その誤差を埋めるためにコストや時間をかけたり、誤差を毛嫌いして調査すること自体をやめたりするのは勿体無いと言えます。

統計的に因果関係を洞察するには、いくつかの概念を知っておく必要があります。「有意水準」や「信頼区間」といった単語を耳に挟んだことはありますか?次回はこれらの解説を行う予定です。

(おまけ)統計学が使えない局面

では、逆に統計学が効果を発揮できないのはどういう時でしょうか。

統計学特有の欠点として、データを分析するものである特性上、データ数自体があまりに少ないと扱いづらいです。

例えば、「月面旅行に行く人の分析をしたい」という要望があったとしても、月面旅行をした(もしくはする予定の)人自体が非常に少ないので「ZOZOTOWN」の創業者前澤友作氏を初めとしたわずか数十人の分析に過ぎないものになってしまいます。これをそのままビジネスに活かせるかというと難しいでしょう。将来的に宇宙旅行が一般的なレジャーになれば話は変わってきますが…

参考文献

西内啓. (2014). 統計学が最強の学問である. ダイヤモンド社.
酒巻隆治, 里洋平. (2015). ビジネス活用事例で学ぶデータサイエンス入門. SBクリエイティブ.

まずはお問い合わせください

お問い合わせ