DOORS DX

ベストなDXへの入り口が
見つかるメディア

「逆問題解析」~人間が受け入れやすい 、自然な解釈を生む数理最適化の新たな活用法~

執筆者
公開日
2021.12.16
更新日
2024.02.21

今回は、数理最適化によるビジネス応用例を紹介する第二弾です。
第一弾はこちら

前回は「汎用ソルバーの進化」によって、アルゴリズム職人に頼る必要がなくなり、データサイエンティストがよりビジネスの上流に近づけるようになったという話をしました。
しかし、見方によってはアルゴリズム職人を汎用ソルバーで「リプレイス」するという話で、あまりメリットを感じられない方もいたかもしれません。
今回のお話は、汎用ソルバーによって新たに解けるようになった問い(逆問題解析|逆解析)について、それがデータ活用のどの立ち位置にあり、どう活用できるのか、データ活用のビジネスシーンを交えながら解説していこうと思います。

本記事の執筆者
  • データサイエンティスト
    魚井 英生
    会社
    株式会社ブレインパッド
    所属
    アナリティクスコンサルティングユニット
    役職
    マネジャー
    物流、マーケティング業界に対して、顧客の意思決定を数理計画法を用いて取り組む。課題解決に向けたコンサルティングから、アプリケーション開発まで、一連の流れを支援する。

データ分析とビジネスシーン~KPIの最大化に向けて~

逆問題解析について説明する前に、ビジネスシーンにおけるデータ分析を今一度振り返ってみたいと思います。その目的は、逆問題解析はビジネスの打ち手を決めるいわば出口の部分に近いのですが、活用を進めるためには、入口から正しい順序で進んでいる必要があるためです。そこでデータ分析の活用をステップに分けて解説したいと思います。

【第0ステップ】はデータ分析基盤、DWHの構築です。
「第0」としているのは、当然必要であるからで、データ活用を家の建築に例えるならば、基盤構築は土地を整備することに相当します。基幹システムとは切り離した形でデータを蓄積していくわけですが、ポイントとしては基幹システムのテーブルをそのままコピーするのではなく、「IDを紐づけて分析しやすい形で整え、それを自動化」することです。基幹システムは高度に正規化されているため、「だれが、いつ、どこで、なにをした」を1行のデータから読み取ることができません。分析が進んでいる企業では、データアーキテクト職としてこの「整備」を行う方がいますが、分析を始めたばかりの企業ではビジネスインパクトを急ぐあまり、この辺りに焦点が当たらずその後の活用が円滑に進まないという話もよく耳にします。

【第1ステップ】は、データの集計・可視化、それに伴うダッシュボードを用いたKPIのモニタリングです。
主なツールはBIツールとSQLです。例として、KPIを月次の優良顧客数としましょう。多くの企業では、KPIを月次で目標値として置いており、月末に進むにしたがって達成のための施策が進みます。SQLを用いてダッシュボードを作成し、それを社内共有することで、誰もがKPIの現状を知ることができます。また、KPIが増減している要因を特定しようと、マーケターやデータサイエンティストが各々の仮説を出し、データを様々な角度から切り出し、レポート化し、今後の意思決定を議論します。しかし、こういった仮説ベースの集計・可視化を繰り返しても、具体的なビジネス施策、企画を考え出すのは、必ずしもデータに基づかない場合が多いです。

例えば、過去の優良顧客数の月次推移を、可視化したとしても、来月その数値をどう伸ばすかは、その図は何も教えてくれません。そこで、いたずらに流入チャネルやユーザー属性で分解したとしても、また新たな仮説が登場し、新しい軸でデータを切るといった探索的な作業が永遠と繰り返されます。その結果、誰も見返すことのない大量のグラフだけが残り、分析は行ったが「データが自分らを導いてくれた」という感覚を得ることはできません。集計ベースの仮説検証はデータ分析の基礎であり、分析の初期段階でデータを把握するという点では良いのですが、深堀りを進めても、その場しのぎのアウトプットしか出せず、労力に見合う結果が期待できないと考えます。

【第2ステップ】として、機械学習の活用が挙げられます。
機械学習の強みは因果関係をベースとした予測値の出力です。来月の優良顧客数を予測するモデルを作成します。ここでは、登録ユーザー1人1人に対して、来月(予測実行日から30日以内)に優良顧客化する確率(スコア)を出力するモデルを考えましょう。説明変数には、ユーザーの年齢、スキルといった属性値や、過去に優良顧客化した回数、登録からの経過日数等を持たせると良いでしょう。それを直近1~2年程度の履歴データを用いて学習します。そしてユーザー1人1人に対して、スコア値を出すことで、来月に優良顧客化する見込みユーザー数を出します。また、予測モデルから、スコアに対してプラスに働く要因とマイナスに働く要因を特定することができます。

ここで強調したいのは、機械学習によって、見込みユーザー数を出すだけでなく、人手の仮説を全て説明変数とすることで、第1ステップの仮説検証を賄えることです。機械学習は予測値を出すものとして認識されがちですが、こういった仮説検証の仕組み化としての利用にも、注目すべきと思います。また、機械学習を好きなタイミングで走らせるようにすれば、仮説検証とKPIの予測値の算出が一挙に担えるため、よりデータドリブンなマーケティングのサイクルが進むと考えます。これは「MLOps」という機械学習の仕組化の話ですので、本記事では割愛しますが、また別のハードルもあります。

第2ステップまで構築できたとしても、先に述べた「データが自分らを導いてくれた」という感覚からはまだ遠いです。なぜなら、機械学習モデルによって「来月の見込み優良顧客数は30万人と予想」したとします。しかし、企業活動には目標値が存在します。よくあるケースとして、KPIが前年同月比の10%増が経営目標として掲げられており、目標人数が32万人だったとしましょう。では、「残りの2万人の優良顧客数」をどのように創出すれば良いのでしょうか?これは現実のビジネスシーンで頻繁に発生する問いです。これは言い換えると、スコアが低いユーザーをどのように回復させれば良いか?という技術的な問いと見なすこともできます。スコアを挙げるための具体的なアクションをデータから導くにはどうすれば良いのでしょうか?意外に思われる方もいるかもしれませんが、機械学習の技術だけでは、この問いに答えることがはできないのです。第3ステップでは、機械学習をシミュレータとみなし、この問いに解く方法を考えます。


逆問題解析で打ち手を

【第3ステップ】は数理最適化です。
前回は、数理最適化の適用範囲として、配送計画のようなサプライチェーンによる活用を紹介しましたが、今回は上記のようなマーケティングのケースを考えてみたいと思います。
数理最適化を簡単におさらいしますと、ある限られた意思決定の範囲の中で(制約条件の中で)KPIといった目的(関数)を最大化あるいは最小化する技術で、機械学習とは異なります。すなわち、数理最適化は因果関係をコンピューター内でシミュレーションし、最も良いアクションを探す方法です。今回のケースでいうと、ユーザーのスコア値が目的関数で、制約条件は、ユーザーのスキルレベルといった操作可能な説明変数です。ユーザー全員のスコア値が回復するように、説明変数を変化させ、その変化した説明変数を打ち手と見なします。例えば、スコア値が0.2で、来月には離脱してしまいそうなAさんがいたとします。そこで「AさんにXというスキル取得を促す」ことで「スコアが0.2から0.5へ回復する」という結果を機械的に出力することができればどうでしょうか?「データが自分らを導いてくれた」という感覚を以前に増して得られるのではないでしょうか。さらにBさんには、Yというスキル取得を促すといったユーザー個別に出力が変わることが期待できます。このシミュレーションを「逆問題解析」と呼びます。それは、機械学習が事実から結果を予測する、順方向なのに対して、これは結果(32万人の優良顧客数)から事実を求める問題、すなわち「逆方向の問題」と見なせるためです。こういった出力の背景にあるのは、機械学習によって過去データを学習しているため、Aさんに似た属性のユーザーでスコアが高いユーザーを学習できている可能性があるためです。そういった類似点を人手で、むやみやたらに探さずに機械的に出力するのが、逆問題解析だとも言えます。

1111111
「2024年問題」で日本の物流になにが起きるのか、より深く知りたい方はこちらもご覧ください。

なぜ今、逆問題解析か?

次に、逆問題解析についてより深く解説したいと思います。逆問題解析は、X線によるレントゲン画像の出力といった非破壊検査の分野での応用の歴史があります。すなわち逆問題解析は、すでに社会的に大きな成功を納めています。しかし、マーケティングや数理最適化の切り口からあまり語られて来なかったように思います。その要因として、逆問題解析には機械学習という数式では表現できない関数を目的関数として設定する難易度が高い技術であることが挙げられます。

これは、「ブラックボックス最適化問題」と呼ばれます。私自身これは数年前から知っており、こういう問題を解けば良いとは思っていたのですが、純粋に手元のソルバーでは取り扱うことができませんでした。しかし、前記事でも述べた昨今の汎用ソルバーの進化により、ブラックボックス最適化問題を扱えるようになりました。こういった背景も、逆問題解析の適用の後押しになると考えています。

上で述べた逆問題解析のビジネス実績は発展途上であり、現在挑戦中です。過去の経験でデータドリブンで出口まで進めなかった悔しさをバネに、考案しました。ぜひとも、他の方々と意見交換したく思います。

逆問題解析のその他分野への適用可能性

これまで、優良顧客の目標達成を例に逆問題解析を解説しましたが、私は他の例にも適用できると考えており、いくつか適用例を紹介したいと思います。

<商品の需要(売上)予測と価格最適化>

商品の需要予測は、データ分析の鉄板のテーマです。ある商品が来月あるいは来週、いくらの売上を出すか、商品の属性や天気といった外部要因を用いながら予測します。その商品属性に価格が含まれています。こちらも上で上げた、優良顧客数と同じように、売上の目標金額や目標個数といったものが存在します。その目標を達成するために、あるいは単に売上を最大化するために、商品属性として、価格を変更することを考えます。こちらも、逆問題解析が適用できると考えます。

<広告予算配分の最適化>

与えられた予算の中で、広告媒体への出稿金額を配分する問題を考えます。こちらも媒体への投下予算の実績と、イベントや季節性といった外部要因よってコンバージョン数を予測します。そこから、限られた予算の制約によって、コンバージョン数が最大となるように、広告媒体への予算配分を考えます。さらに、広告主が許可する予算額を制約条件として与えても良いです。こちらも同様に、逆問題解析として考えられます。

<商品開発における配合の最適化>

与えられた種類の配合を用いて、商品の特性を再現する問題を考えます。配合の値によって、特性を予測するモデルを構築し、次にユーザーがほしい特性からどのような配合が必要かを逆算します。こちらも同様に、逆問題解析が適用できます。

これらの課題に対して、逆問題解析が全ての解決手段となるわけではないですが、私は逆問題解析は、「ほしい結果から手段を探る」という手順であることから、これは「人間が受け入れやすい、自然なアプローチ」であるように感じています。機械で出した施策を現場の担当者の方に利用してもらうためには、むやみやたらに数学的に高度化するよりも、人に説明しやすいアプローチであることが重要なことは多々あります。こういった点からも逆問題解析を用いるメリットがあるかと考えています。

逆問題解析の注意点、課題点

最後に、逆問題解析を行う上での注意点、課題点を述べたいと思います。逆問題解析は魅力的ではあるのですが、いくつか課題があり、データサイエンティストは意識して使う必要があります。

1つ目は「膨大な計算量」です。ブラックボックス最適化問題は、まだまだ発展途上で、高速に答えが出ることは期待できません。特に制約条件が加わった場合だと、探索が強く制限されます。とはいえ、解く必要があるため、どのような条件で、どのくらいのデータ規模なら現実時間内に解けるのか、研究を続けて行く必要があります。

2つ目は「機械学習器の信頼性による結果の制御」です。機械学習の出す予測値には誤差が含まれるため、完全に信用できるわけではないということを忘れてはいけません。機械学習器は、基本的に学習した過去データに近い領域(内装領域)では、信用度の高い結果を返しますが、過去データにない領域(外装領域)では信用度が低くなります。しかし、ビジネスでは過去データにはない値で試してみるということも重要で、その際に外装領域がどの程度信頼できそうかを定量化する必要があります。これは「探索(外装)と活用(内装)のトレードオフ」と呼ばれたりもしますが、どちらを優先するかを制御する仕組みを考える必要があります。

まとめ

本記事では、実際のビジネスシーンを多く交えながら、逆問題解析の可能性、および汎用ソルバーの進化について解説していきました。昨今は表層的なAIブームが終焉に近づき、本当に価値のあるアプローチは何かが深く吟味されていると感じます。

具体的なビジネスシーンを想定し、それに伴うアウトプットを適切な技術を用いてアプローチできる人材が求められています。ブーム時を振り返ると、正直、具体的な分析手段には焦点を当てず、データサイエンティストに大量のデータと業務説明資料を渡しておけば、きっとKPIを改善する何かを出してくれるという、現実離れした期待があったように思います。そういった過度な期待から苦しんだデータサイエンティストも多くいたのではないでしょうか。そういった背景から、一昔前は、単純な集計・可視化の見た目をデコレーションし、スライドでストーリーを作り、うまく相手を説得させるのが優秀なデータサイエンティストだという文化も叫ばれました。しかし、私はこれは科学者の取るべき行動ではないように感じます。また、純粋にこのアプローチでは論理の穴を拭いきれません。やはり、科学的に適切なアプローチを用いて問題解決を行う事がデータサイエンティストのあるべき姿だと思います。

そういった、ビジネスと技術の狭間で苦しんでいるデータサイエンティストに、逆問題解析が一助になれば思います。これは、ブレインパッドに限らない話で、今後もこういったビジネスと技術を合わせた、具体的な記事を発信していきたいと思います。

【関連記事】

数理最適化については、こちらの記事もぜひご一読ください。

数理最適化の新時代到来 ~最適化→予測でDXは加速する~

DXについてはこちらの記事で詳しく解説しています。

DX(デジタルトランスフォーメーション)とは?今さら聞けない意味・定義・事例をわかりやすく解説【2024年最新版】


このページをシェアする

株式会社ブレインパッドについて

2004年の創業以来、「データ活用の促進を通じて持続可能な未来をつくる」をミッションに掲げ、データの可能性をまっすぐに信じてきたブレインパッドは、データ活用を核としたDX実践経験により、あらゆる社会課題や業界、企業の課題解決に貢献してきました。 そのため、「DXの核心はデータ活用」にあり、日々蓄積されるデータをうまく活用し、データドリブン経営に舵を切ることであると私達は考えています。

メールマガジン

Mail Magazine