メルマガ登録
第7回はこちら
マーケティング領域での意思決定とデータとの関わりを論じる本シリーズ。
前回、意思決定におけるデータの大きな役割として、各選択肢で得られる結果とその結果が得られる確率を推定することを挙げました。今回は、その推定というのがどういうものかについて論じ、そこから意思決定問題の定義の重要性を導き、この連載を終えたいと思います。
まず、前回も扱ったとんかつ屋の定休日についての意思決定を例に、データの量と推定の信頼度について考えます。
年中無休で営業してきたとんかつ屋が、週一回の定休日を決めようとしています。何曜日を定休日としますか?ただし、どの曜日にしても、仕入れやバイトのシフトなどには影響しないものとします。
このような意思決定で、前回は過去3年間の曜日別平均売上をグラフ化した下図を参照して、この先も火曜日の売上が低いであろうと推定することで、火曜日を定休日にする、という意思決定を行いました。
ではここで、もうひとつのグラフをみてみましょう。
下図は、同じとんかつ屋の先週の売上をグラフ化したものです。
さて、みなさんはこのグラフをみて、火曜日を定休日にするのをやめ、木曜日を定休日としますか?
恐らく、多くの方は、1週間だけの結果よりも、3年間の平均値を重視して、火曜日を定休日にする方を支持されると思います。
そこには、推定値に対する我々の自然な感覚が見て取れます。すなわち、我々は自然と、参照する過去のデータが多ければ多いほど、そこからの推定値を信頼しやすくなるのです。
そしてその感覚は、統計学的にも支持されます。「大数の法則」というのを、みなさんも聞いたことがあるかもしれません。ここでは詳しい説明は省きますが、何度もデータを取ることで、そのデータによる推定値が真の値に近づくという法則で、統計学の基礎をなすものです。
次に、以下のような意思決定問題について考えてみましょう。
商品Xの営業をしています。ふたりの見込み客のうち、どちらか片方にしか声をかけられないとするなら、どちらに声をかけますか?
思考実験ですので、実際にはありえませんが、商品Xが何かは知らないまま営業するものと考えてください。これも、とんかつ屋の定休日と同じように、何の情報も与えられなければ選びようがありませんね。
では、過去の営業実績をみてみましょう。集計した結果、以下のとおりでした。
さて、この結果をみてみなさんなら、男性と女性、どちらに声をかけますか?
恐らく多くの方が、男性に声をかけるという意思決定をされると思います。
ここにも、推定値に対する我々の自然な感覚が働いているのがお分かりになるでしょうか?
先ほど、データが多ければ多いほど推定値を信頼しやすいという感覚が我々に備わっていることを確認しました。そうであるならば、なぜ我々は、全体の購入割合を信頼して、どちらに声をかけても同じだと判断しなかったのでしょうか?それは、我々が自然と選択肢と過去のデータの性質を比べ、より似ている方を採用しているからだと考えられます。すなわち、我々は、参照する過去のデータの性質と選択肢とが似ていれば似ているほど、そこからの推定値を信頼しやすくなるのです。
続いて、今の意思決定問題をアレンジしてみます。
商品Xの営業をしています。ふたりの見込み客のうち、どちらか片方にしか声をかけられないとするなら、どちらに声をかけますか?
先ほど集計した営業実績には年代はありませんでしたので、このままですと、40代男性に声をかける方が合理的であるように感じます。
そこで、今度は性年代を分けて集計することにしてみました。結果は下表のとおりです。
いかがでしょうか。20代女性の方が購入割合は高かったことが分かりますが、データの量が不足していると思うのが自然な感覚でしょう。もちろん、統計学的仮説検定をしてみても、これらの割合に有意差はないと結論付けられます。
このように、データの性質と選択肢との類似度を高くしようとすると、当然ながらデータの量は少なくなってしまいます。これが、推定値の信頼度の抱えるジレンマです。すなわち、推定値の信頼度を高めようとして類似度を追求すれば、データ量が少なくなるために信頼度が損なわれ、データ量を多くして信頼度を高めようとすると、類似度が低くなるために信頼度が損なわれるのです。
そしてこのジレンマを考えるとき、ビッグデータの価値が改めて認識されるのです。もうお分かりかと思いますが、データが莫大であれば、データの性質と選択肢との類似度とをかなり高めてもデータの量を確保でき、より信頼度の高い推定値が得られることになると考えられるわけです。
例えばこの例で、自分の営業実績だけでなく、全社の営業実績を集計し、以下のような結果を得たとしましょう。
もちろん、これまでこの連載で論じてきたとおり、このような結果が得られたからといって、「なぜこのような結果になったのか」を考えずに意思決定をすることは避けるべきです。
しかし少なくとも、なぜこうなったのかを考えるべきである、ということには自信がもてるでしょう。どうみても、20代女性の方が40代男性よりも購入割合が高いからです。
これまでみてきた意思決定問題で、推定値について、我々に自然と備わっている別の性質に気づかれたでしょうか。
我々は、過去のデータから得られる平均値を、選択肢を選んだ際の期待値と考え、同じくそこから得られる割合をある結果が得られる確率と考えているのです。
実は、どんなに高度な統計手法であろうと、機械学習の技術であろうと、基本的な考え方は同じです。
つい先日、マーケターの方から、「普段は統計学的手法なんて全く使ってないんですけど……」というような話を聞きました。私が、「平均や割合を計算することはないのですか?」と聞き返したところ、それはある、とおっしゃいました。私は、「じゃあ立派に統計学使ってますよ」とお答えしました。
私は職業柄、このように実務でデータを活かしきれていない、という相談を受けることが多くあります。そして、データをより上手く活用するために、統計学や機械学習について学び始める方々をよくみます。
もちろん、それを学ぶことは有用でしょう。しかし私はその前に、データをどのような意思決定に活用したいのかについてきちんと考えてみることをおすすめします。それがきちんと定義できれば、難しい手法を使わなくても、平均値と割合だけで良い意思決定ができることは多いのです。
さて、全8回に渡ってマーケティングの意思決定とデータとの関わりについて、私なりに論じてみましたが、いかがでしたでしょうか。少しでも皆様のお役に立てたのなら幸いです。
実は、私がビジネスでのデータ活用について、マーケターの方にレクチャーをするときには、第7・8回の内容(意思決定理論とデータとの関わり)から始めるようにしています。
それは、ビジネスでのデータ活用で最も重要なのは、データを使って何をしようとするのかをきちんと定義することだという信念があるからです(そして口述するときには大切なことから先に話すべきと考えているからです)。
そしてこの意思決定理論とデータとの関わりについては、まだまだ本連載では触れられなかった奥深いところがあります。もし、本連載をきっかけに興味をもたれた方がいらっしゃったら、意思決定理論についての書籍を是非読んでみてください(因みに私も著作があります)。もしかすると、統計学の本を読むよりも、より直接的にデータ活用に役立つかもしれません。
DX推進が叫ばれる今、みなさんがデータを有効に活用され、ビジネスを成功に導かれることを祈念しております。
第1回:マーケティングとDX
第2回:マーケティングの意思決定とKPI
第3回:マーケティングの意思決定とKPI
第4回:消費者理解のためのデータ活用
第5回:データとビジネス機会の関係
第6回:数式の果たす役割
第7回:意思決定とデータ
第8回:データによる結果と確率の推定
あなたにオススメの記事
2023.12.01
生成AI(ジェネレーティブAI)とは?ChatGPTとの違いや仕組み・種類・活用事例
2023.09.21
DX(デジタルトランスフォーメーション)とは?今さら聞けない意味・定義を分かりやすく解説【2024年最新】
2023.11.24
【現役社員が解説】データサイエンティストとは?仕事内容やAI・DX時代に必要なスキル
2023.09.08
DX事例26選:6つの業界別に紹介~有名企業はどんなDXをやっている?~【2024年最新版】
2023.08.23
LLM(大規模言語モデル)とは?生成AIとの違いや活用事例・課題
2024.03.22
生成AIの評価指標・ベンチマークとそれらに関連する問題点や限界を解説