メルマガ登録
データエンジニアリング本部ソリューション開発部グループマネージャーの石母田玲です。私は新卒でデータベースベンダーに入社し、13年目にゲーム会社へ転職、ブレインパッドには3年前に入社しました。社会人になってからずっとデータ基盤構築の開発・運用に携わってきています。ブレインパッドに入社したのもそのキャリアが生かせる上に、様々な業種に関われ、またパブリッククラウドを利用する仕事ができるからでした。
ブレインパッドに入社してからは、教育関連事業、金融業、流通業、飲料メーカーなどの業種のプロジェクトに参画する傍ら、リーダーおよびスペシャリストの両方の育成に力を入れています。
今回、「データ基盤・データ活用に投資する前に準備するべきこと」というテーマを選んだ背景としては、最近データ基盤を自社で持たなければいけないという考え方が一般的になってきたことがあります。
そうした中、とりあえずデータ基盤を持ちさえすれば、「夢の解決法が見つかるのではないか」、「新しいビジネスが次々と生まれるのではないか」という「誤解」がまん延しています。
しかし目的があってこそのデータ基盤なのです。
データ基盤構築には相応の投資が必要になりますが、目的がなければその投資が無駄になってしまいます。
もちろん私たちも目的の明確化の支援はしますが、自社のことを一番深く知っているのはクライアント側の社員です。データ基盤構築もデータ活用も目的達成の手段だという意識を持って、社員主体で考えるべきというスタンスでいていただきたいと強く思うのです。
本稿は、その「考えるべきところ」をお伝えするものです。考えるべき内容および考える順序は以下の6点でまとめてみました。
「データがサイロ化されているので一箇所に集め、横串を通して分析したい」、「ストレージ容量が少なくて直近1年分ぐらいのデータしか分析できない」といった問題であれば、データ基盤を構築すれば解決するかもしれません。
しかし、例えば「とりあえずデータ基盤を作ってもらい、ブレインパッドが持っている同業他社事例を教えてもらえれば、課題解決の答えが手に入るだろう」というのはどうでしょうか。実際にこのようなお声がけをいただくことが多いのです。
他社と自社の問題点が同じであることはまずありません。同じ業種・業態でも地方と東京では、顧客の所得、生活レベル、趣味嗜好などがまったく違います。そもそもデータが違うわけです。あるいは同じ地域の同業でも、生き残りの条件が差別化・独自化であれば事情は違います。他社事例にも参考になる部分もあるかもしれませんが、それ以前に自社の顧客と向き合って分析し、施策を決めるべきなのです。
また他社事例を提示するといっても、問題点の詳細は守秘義務もありお話しできません。いずれにしても自社の問題点は自分たちで整理するしかないのです。逆に業務やデータ活用における問題点をある程度整理いただくと、解決策とそのコストの見通しがつきやすくなり、無駄な投資が防げる可能性が高まります。
以前の業務システムであれば「ベストプラクティス」を当てはめれば解決できることも多かったのかもしれません。しかしむしろベストプラクティスが見えないがための打開策がAI活用だったりDXだったりするわけです。他社事例は解決策立案のヒントにはなっても、それ自体が解決策にはなり得ないのです。
とりあえずデータ基盤を作って、データを貯めてから試行錯誤し、何をやっていくかを決めるやり方もありますが、そのやり方だと社内での合意が取りづらい場合が多く、結局「お金をかけてデータ基盤を作って何をするんだ」、「それでいくら儲かるんだ」といった話になりがちです。やはり、これらの問いにどう答えるかを先に考える必要があります。
オフィスにコーヒーやお茶のサーバーを設置して、水をデリバリーする事業をしている会社があります。これが主要な業態なのですが、清掃用品をレンタルする事業部もありました。
それぞれが別々に顧客データを管理していたためクロスセルができていなかったのです。
既に取引がある会社だからクロスセルは比較的容易なのにもったいないという話になり、私たちに相談がありました。そこで事業部横断のデータ基盤を構築するのはもちろん、顧客データを統合するために名寄せが必要だと提案したのです。
スムーズに進んだ案件でしたが、私たちがニーズを掘り起こして提案したわけではなく、お客様側に目的があり、データ基盤を構築して何をしたいか(=クロスセル)が明確だったのでスムーズだったのです。
ただはじめからやりたいことをすべて明確にしておく必要はありません。そもそもそれは無理なことです。会社に2,000種類ぐらいのデータがあったとして、その中からやりたいことの実現に使えそうな100種類だけでまず基盤を構築するやり方、すなわち「スモールスタート」がセオリーです。
そのためにはパブリッククラウド上にデータ基盤を構築することが有利になります。それは低価格だからではありません。同じスペックのものを用意するのであれば、クラウドはオンプレミスより高価になることのほうが多いのです。クラウドの良さは、少しずつ大きくしていくことが簡単にできることにあります(場合によっては小さくすることも容易です)。最初に最終形を考える必要がないのがクラウドの利点であり、それはスモールスタートに向いているということなのです。
このようなことは、データを活用する文化がない会社ではよくあることで、そのような会社ではやりたいことを決めてデータを蓄積しても結局使われないことがあるのです。データを貯めること(データ基盤構築)と使うこと(実現すること)の両方を考えないと、データを貯めても宝の持ち腐れになってしまいます。
現状の問題点を整理し、データを活用することで実現したいことも決まりました。ではデータ基盤構築プロジェクトにゴーサインを出そう…と思ったのはいいのですが、「ところで本当にデータはあるんでしたっけ?」ということがよくあります。
欲しいデータがどこに、どのような形式で、どれぐらいの期間保管されているかを、まず調査をする必要があるということです。これもスモールスタートで構いません。当面実現したいことに必要なデータについて調査し、整理しておけばよいでしょう。そのための要員を社内でアサインする必要があります。
後述する「電子データ化されていない有用な情報」を除くと、精緻なデータが存在しない原因としてよくあるのは、データ入力を人に頼るということです。例えばある会社では、運転手が店舗についたら「ボタン」を押すというオペレーションでデータを取得していました。しかし運転手の本来の仕事は荷物を運ぶことで、ボタンを押すことではありません。どうしても押し忘れが発生するので、データの精度が低くなるのです。
そのデータがどうやって発生するのかを把握することも重要ということです。お店についたら「ボタン」を運転手が押しているとわかっていれば、データを使う側で保管する/読み飛ばす/捨てるなどの対処が可能になります。知らないと精度の低いデータで分析することになってしまいます。
それ以前に正しいデータを取るために、できるだけ機械的に取る方法を考えることが大切です。ただそうなるとそれなりに投資が必要になる場合もあり、そのコストに見合う成果が出るのかも検討する必要があるでしょう。
とはいえまだ準備段階なので、あまり細かく考える必要はありません。わかる範囲で洗い出せていれば十分です。データ基盤を作ってからデータがおかしいとわかることもよくあることなのです。その際には分析する側が手作業でデータのクレンジングを行えば済むことも多いですが、致命的な問題だった場合には業務フローの見直しをせざるを得ません。問題が出たタイミングで対応するということで大丈夫です。
自社内のデータだけで分析ができればいいのですが、気象データや地域の特性データ、統計情報、各種白書、帝国データバンクのデータなども合わせて使うほうが良い分析になることもあります。どのようなデータが使えそうか、有料・無料を問わず整理しておきましょう。
自社データの調査が先なのは、やはり自社データのほうが自社の業務の実態を表している為、優先順位が高いからです。したがって外部データについては、追い追い探していくというアプローチでも構いません。
ただ実際には、外部データに関してはお客様のほうでもしっかりと把握していることが多いのです。自社データは、他部門でしか見られない場所にあると存在さえわかりません。一方外部データは有料・無料に関係なく、欲しいものがあれば検索して、端末にダウンロードすれば(もちろん有料であれば社内稟議を通す必要がありますが)使えてしまうからです。
今どきこのような会社は少ないと信じたいのですが、私たちに依頼があった会社でも、重要なデータは紙にしかないことや、Excelで管理されているが、印刷を目的とした形式になっておりデータとして扱える形になっていないということが実際にありました。
電子データ化できるものはやはり電子化するほうがよいのです。紙にしかないデータがあれば、電子化を検討する必要があると思います。
紙の文書をスキャナーで読んでPDF化し、さらにRPAを使ってPDFから電子データを作るというのは、紙の文書をやめてシステム化するのに比べてコストをかけずにできるはずです。
データ活用を推進するためには、データを使う人とデータ基盤を作る人のそれぞれで専任の責任者をアサインする必要があると思います。専任といってもプロジェクトに100%の時間を費やすという意味ではなく、プロジェクトにおけるクライアント側の責任者が誰かをはっきりさせるという意味です。どちらか片方でもよいのですが、理想を言えば両方です。
どちらか片方しかアサインできないのであれば、業務部門担当が望ましいと言えます。より良いデータ活用を実現するためには、使う側の意見を十分に取り入れながら進める必要があるからです。システム部門担当がこんなデータがあるとどんな活用ができるだろうというのを考えるだけだと本当に使えるデータ基盤はでき上がりません。プロジェクトが終わるまでずっと専任は無理だというのであれば、少なくとも要件を決めて、設計するフェーズまでは専任を置いてほしいものです。
とはいえ業務部門担当だけだと、システムセキュリティやシステム構築に関わるルールがよくわかりません。それでは大切なデータ基盤は作れないので、システムに明るく、システムに関する自社独自の文化やルールがわかる人も一方で必要なのです。構築した基盤の品質などもチェックしてもらわないといけないので、できれば専任の窓口担当を置いたほうがよいでしょう。
業務部門とシステム部門の両方の専任担当を置くのが理想ですが、実際に両方置かれた場合、システム側が強すぎると、システムの制約が前面になりがちで、データ基盤としての発展性が阻害されやすくなります。一方で業務側が強すぎると結局実現不可能だということがあとでわかることが多くなります。どちらかがリードするという形ではなく、二人三脚でバランス良く、一体になってゴールを決めることが肝心です。
どちらが予算を持っているかはケースバイケースですが、予算を持っている側が強いということでは失敗しがちになります。
ここまで準備しておけば、データ基盤・データ活用プロジェクトの成功確率はかなり高まっているはずです。あとはRFPを作成して提案依頼をし、ベンダーも交えてプロジェクトを開始するだけです。
「ビッグデータ」という言葉が世の中に広まったのは、ちょうど日本でもクラウドが注目され始めた2010年頃だったと思います。私は社会人10年目ぐらいでした。このときは「いよいよデータ活用時代が来たな」と感じたのですが、結局予感は外れました。次に「Googleの猫」などの成果から第3次AIブームとなり、データの重要性が見直されてきました。とはいえPoCがほとんどで、なかなかビジネスでの実用化に至りません。それが「2025年の崖」でDXが叫ばれるようになり、さらにコロナ禍で一気に加速したのです。22年間、データ活用一筋に取り組んできた私としては、嬉しい状況になってきました。
データ活用が進んでいる会社もありますが、多くの会社がこの2年ぐらいでようやく本格的なデータ活用に取り組み始めたのではないかと思います。できていない会社もまだまだあることでしょう。
せっかく火がついてきたので、「みんなで頑張ってデータ活用をしましょう!」と声を大にして言いたいのです。そしてこの火を日本中に早く広げたいと思っています。
あなたにオススメの記事
2023.12.01
生成AI(ジェネレーティブAI)とは?ChatGPTとの違いや仕組み・種類・活用事例
2023.09.21
DX(デジタルトランスフォーメーション)とは?今さら聞けない意味・定義を分かりやすく解説【2024年最新】
2023.11.24
【現役社員が解説】データサイエンティストとは?仕事内容やAI・DX時代に必要なスキル
2023.09.08
DX事例26選:6つの業界別に紹介~有名企業はどんなDXをやっている?~【2024年最新版】
2023.08.23
LLM(大規模言語モデル)とは?生成AIとの違いや活用事例・課題
2024.03.22
生成AIの評価指標・ベンチマークとそれらに関連する問題点や限界を解説