メルマガ登録
私はデータサイエンティストおよびプロジェクトマネージャーとして、これまで数多くのデータ分析のプロジェクトに参画してきました。そこで培った経験や知見を元に、現在ではプロジェクトのデリバー活動に加えて、営業やコンサルタントと共同して、データ分析プロジェクトのプリセールス活動を行っています。
データ分析プロジェクトでは、「いかに早く意味ある結果を出せるか」が成否を分けます。早く結果を出すには、「プロジェクトが目指すゴール」と「ゴールに向けて実施すること」を早い段階で策定することが重要で、そのためには、クライアントの協力も不可欠と考えています。
本稿では、まずデータサイエンティスト視点で、プロジェクトの最初期段階のプリセールス活動の流れを説明します。次にクライアント企業の方に協力いただきたい点についてまとめました。
ベンダーとワンチームでDXプロジェクトを進めていく際の参考になれば幸いです。
プリセールスの目的は、「プロジェクトの目指すゴール」を明らかにし、「ゴールへ向けて実施すること」を決めることです。
具体的に実施することは、「(依頼事項や本質的な課題の)ヒアリング」、「保有データの確認」「提案書の作成」の3ステップです。順に説明します。
まずは、クライアントの要望や課題をヒアリングします。
ヒアリングの目的は、「プロジェクトの目指すゴール」について共通認識を得ることです。私は、「プロジェクトの目指すゴール」と「ゴールに向けて実施すること」は、異なるものと捉えています。
例えば、相談内容が「食料品の廃棄を減らすために、需要予測をもとにオペレーションを変更したい」という要望であれば、目指すゴールは、「食料品の廃棄を減らすこと」、ゴールに向けた(直近での)アクションは「需要予測が実現できるかの検証」となります。目指すゴールがなく、需要予測の実現可能性の検証だけに取り組むと、「どの程度予測精度があれば、取り組みが成功したといえるのか?」といった取り組みの成否判断がつきません。
このように、「目指すゴール」と「ゴールに向けて実施すること」を具体的に持っておく必要があります。
目指すゴールはわからずとも、可能な限り高精度なモデルを作ればよいと思われるかもしれません。しかし目指すゴールが明確であるがゆえに、取り組み内容が精緻になるケースもあります。需要予測を例にすれば、どのタイミングで予測を行うかにより、用いることができるデータや手法のバリエーションが増えることがあります。
以前、ある商業施設において、「当日のサービス利用者数を予測する取り組み」を支援させていただいたことがあります。一見すると、前日までのサービス利用実績から当日のサービス利用者数を予測するモデルを策定することになりそうですが、予測値が必要なオペレーションは当日午後の業務のため、実は、午前中のサービス利用状況のデータを、予測モデルに使うことができました。それによって業務オペレーションに必要な当日午後のサービス利用者数をより正確に予測することが可能になりました。
当日のサービス利用実績情報は予測モデルに有用な情報だったのです。
次のステップでは、「目指すゴール」と「ゴールに向けて実施すること」に必要なクライアント側の保有データを確認します。プリセールスの段階で、データを提供する必要があるのか疑問に思われるかもしれませんが、あらかじめ保有データを確認することで、分析方針の検討と工数見積もりができます。
データ分析のプロジェクトでは、データ(と業務)の理解、データ加工処理に多くの工数を使います。サンプルのデータでも事前に提供いただけると、どの程度工数がかかりそうか、あたりをつけることができます。
結果として、スケジュールが精緻になります。また、データの項目や保持期間を把握することは、分析設計上も重要です。例えば、「過去数年分のデータが保持されていることを仮定した効果検証方法や予測モデル案を検討していたが、実際には1年分のデータしか残っていなかった」といったケースを避けることができます。
最後に具体的な提案の作成をします。プロジェクトの目指すゴールを抑えつつ、まずPoCを実施することが多いので、PoCにて「何を」「いつまでに」「どうやるか」を記載します。
PoCに関しては、下記記事でより具体的なイメージを持っていただけると思いますので、あわせてご覧ください。
【関連】機械学習プロジェクトを推進するにあたって大切なこと ~DX推進時の「企画・PoC 」フェーズの落とし穴にはまらないために~
ここまでは、プリセールス活動の中で、データサイエンティストが実施することや、考えていることを説明しました。
これらの活動の中で、クライアント企業様に依頼することがいくつかあります。
プロジェクトの初期段階で「目指すゴール」と「目指すゴールに向けて実施すること」に共通認識を持つことが重要だとお話ししました。相談を頂く時点で、どの程度明確になっているはケースによって異なります。(下図参照)。
いずれのケースでも、相談の背景や業務に関する知識、さらにはデータが生成されるタイミングやルールなどデータに関する仕様などを共有いただけると、その後のプロジェクト進行がスムーズになります。
パターン1のように、目指すゴールとそれに向けたアクションが明確な場合は、提案は比較的スムーズに進みます。過去のプロジェクト経験から、どのようなデータが必要で、どのようなモデルを作り、どういう示唆を出せばいいか予想できることが多いからです。一方で、ゴールへの実現案が、本当に目指すゴールにつながっているかは、注意が必要です。
例えば、目指すゴールが「食料廃棄を減らすこと」で、そのために実施することが「需要予測」であるとします。この場合、需要予測の結果をもとに、何のオペレーションをどのように変えればよいかがわからなければ、たとえ需要予測モデルが構築ができても、目指すゴールは達成できません。(正確には取り組みの成否判断も出来ません。)
パターン2のように、目指すゴールは明確ですが、ゴールへの実現案が明確でない場合、例えば自社サービスのユーザー数を増やしたいが、何かできないか?といった内容であれば、直線的に提案までには結びつきません。
まずは目指すゴールを策定するに至った背景、実現可能な施策の方向性を相談しながら掘り下げていくプロセスが必要になります。
パターン3のように、データ活用を通じて、業務を変革していきたいような抽象度の高い依頼が最近、非常に増えてきている印象です。このパターンはまさに、いずれも「NO」であると言えます。
この場合、コンサルタントを含めたプロジェクト体制で、まずは目指すゴールを策定していき、その後にパターン2のようにゴールへの実現案を掘り下げていく形になります。
クライアント企業様には、依頼いただいているテーマに関して、過去に似たような取り組みがあれば、可能な範囲で共有いただきたいと考えています。
取り組みの経緯や実施内容、結果などを説明していただけると、業務理解の工数の削減、同じような取り組みで時間を無駄にするリスクの回避につながります。
「保有データの確認」の項にあるように、可能な範囲でデータとテーブル定義などのデータ理解に必要な情報の提供をいただきたいと考えています。
「保有データの確認」のプロセスは、データ項目の集計、データ期間の確認、複数データ間の関係の理解(テーブルとテーブルの結合条件など)などを実施します。適切に集計するためには、データ項目の理解が必要になり、システムと業務のそれぞれの観点で、質問をさせていただくことになることが多いです。
そのため、早い段階でシステムや業務の担当者様にプロジェクトに参画いただけけると、取り組みが効率的になります。
例えば、プロジェクト開始後に必要なデータが足りず、データの提供を依頼するも、スムーズに提供いただけずお互いに時間を無駄にしてしまうような事態を避けることができます。
本稿の執筆にあたり、これまでの取り組みを振り返り、どうすればプロジェクトがうまく進むのかを改めて考えました。
結果、「いかに早く意味ある結果を出せるか」がポイントで、そのために必要なことは、「プロジェクトの目指すゴール」と「ゴールに向けて実施すること」について、クライアント企業様と共通認識を持ち、共同でプロジェクトを推進することと思い至りました。
本稿の内容は、皆様にとって少しでも参考になる点がありましたら幸いです。
DXの本質について改めて知りたい方は、こちらの記事もぜひご一読ください。
あなたにオススメの記事
2023.12.01
生成AI(ジェネレーティブAI)とは?ChatGPTとの違いや仕組み・種類・活用事例
2023.09.21
DX(デジタルトランスフォーメーション)とは?今さら聞けない意味・定義を分かりやすく解説【2024年最新】
2023.11.24
【現役社員が解説】データサイエンティストとは?仕事内容やAI・DX時代に必要なスキル
2023.09.08
DX事例26選:6つの業界別に紹介~有名企業はどんなDXをやっている?~【2024年最新版】
2023.08.23
LLM(大規模言語モデル)とは?生成AIとの違いや活用事例・課題
2024.03.22
生成AIの評価指標・ベンチマークとそれらに関連する問題点や限界を解説