メルマガ登録
2022年現在、多くの企業がDX推進に取り組むようになり、業務のデジタル化が進展している中、「データガバナンス」の必要性が叫ばれるようになった。しかし言葉だけが一人歩きし、多くの企業がデータガバナンスの真の意味を理解していないように見える。
そこで当社データビジネス開発部 シニアマネジャー・櫻井洸平がオーガナイザーを務め、社内有識者と対談しながらデータガバナンスについて解き明かしていく連載を企画した。櫻井は、3大クラウド(AWS、Azure、GCP)をプラットフォームとして、数多くの企業のデータ基盤構築の支援や、分析効果を発揮するための施策や組織の立ち上げなど企業のDX推進を支援してきている経験から、データを適切に活用するためにはデータガバナンスが重要であると捉えている。
第3回は、櫻井と同部署の崎山栞里がファシリテーターを務め、データサイエンティストとして多くの分析プロジェクトを担い、かつ現在は150名を超えるデータサイエンティストが所属する部署の副部長をともに務める辻陽行、原真一郎を招き、昨今のデータ分析で重要なこと、データサイエンティストにとって最適なデータガバナンスについて考察を深めていく。
■登場者紹介
独立系SIerにて、オンプレ、プライベート、パブリッククラウドのインフラ全般の技術知識から、お客様へクラウドシフト、クラウド活用、クラウド推進のコンサルティングを経験。ブレインパッドに参画後 企業におけるデータ活用のためのシステム企画から、活用を推進する組織醸成や人材育成のコンサルティングをプロジェクトマネージャとして対応。
法学部卒業後、2021年にコンサルタントとしてブレインパッドに新卒入社。入社後は、建設業界の業務DXや人材業界のデータガバナンス支援、金融業界の事業開発支援等のプロジェクトに従事。
機械学習を用いた需要予測や判別問題に関する事例を担当。プロジェクトの立ち上げから機械学習アルゴリズムの仕組み化の支援までを主に担当。
マーケティング領域におけるデータ分析を用いた顧客の意思決定支援を数多く担当。状態空間モデルを用いた来店人数予測や、広告出稿の最適化などを実施。
ブレインパッド・櫻井洸平(以下、櫻井) 前回は、データビジネス開発部のコンサルタントである神野さんと私で、データガバナンスとは何か、ブレインパッドが定義している推進方針、これらをなぜブレインパッドが推奨しているのかについて議論しました。
その中で、データガバナンスというとルールを策定して、それが守られるための仕組み作りをするという「守り」の側面をイメージされることが多いのですが、ビジネス価値を高めるという「攻め」の側面こそが重要であることが特に強調したいところでした。
今回はデータサイエンティストとして経験豊富な辻さん、原さんがこれまで、顧客企業と一緒になってデータ分析・活用を進めている中で、どんなことを大切にしているかを伺いながら、現場のデータ利用者の立場から見たデータガバナンスについて考えていきたいと思っています。よろしくお願いします。
ブレインパッド・崎山栞里(以下、崎山) まずデータサイエンティストの方々が、データ分析を通じてビジネス価値を創造するために重要だと思っていることからお尋ねします。
ブレインパッド・原真一郎(以下、原) 「価値のあるデータ」とはどういうものかを理解していることだと思います。顧客の持っているデータから「価値のあるデータ」を見出し、集めるための支援を行うことも、データサイエンティストとしての役割だと考えています。
ブレインパッド・辻陽行(以下、辻) 原さんの言うことももちろんなのですが、支援会社の立場である私たちが支援しないと価値あるデータが集められないというのは、その企業にとって健全なことではありません。社内で分析プロジェクトをグリップして回していける人材を育てていくことも重要だと思います。
これまではデータ活用といえば、データ分析そのものにフォーカスが当たっていましたが、今はデータ分析をどう運用に組み込んでいくかに関心がシフトしてきています。
櫻井 お2人に共通しているのは、ビジネス成果を意識されているということですね。データサイエンティストの活動の幅が広がっていると感じます。
辻 分析でどうやってビジネスにインパクトを与えられるか、さらに分析プロジェクトをどういう人材で動かしていくのかも含めて相談されることが増えてきました。そうなると今見えている問題だけではなく、今後起こり得るであろう問題も一緒に解決できるパートナーとして選んでもらえるかが大切になってきます。
原 ただ、分析プロジェクトを初めて経験するお客様に対して、ビジネスインパクトを机上で試算し提示しても、お客様側で具体的にイメージができないため、全面的に信用してもらうのは難しいです。そこでまず小さい範囲でやってみて成果を示していき、徐々に信頼感を高めていくことが重要になってきます。
崎山 データ分析のプロセスについてお聞きします。一般的なプロセスは、①ゴール設計、②データ理解、③分析用データマート設計、④データマート構築、⑤モデル作成、⑥モデル実行環境構築となります。この中でデータサイエンティストのみなさんが特に大変だと思うのはどのステップなのでしょうか。
原 「②データ理解」でしょうか。分析用のデータ環境がしっかり整備されている会社は、現時点でまだまだ少ないと思います。データベース定義書やデータ定義書などのドキュメント類がなかったり、あっても現実と食い違っていたり。現場で使われているデータはデジタル化されていないことも多く、段ボール箱をひっくり返して紙データを集め、自分たちでデジタル化することもよくあります。分析をする上で履歴データが必要になることが多いのですが、最新のデータしかないことも多いです。
辻 私も、分析のためにデータを整備している企業は少ない印象があります。ただ、データサイエンスを軸にビジネスを立ち上げようとしているスタートアップ企業なら分析のためのデータを揃えていると思われます。
あと、一般的なデータ分析のプロセスでちょっと思うことがありまして。
崎山 あれ、間違えていましたか・・・?
辻 いえ、間違っていないですよ。順序としては、モデルを作成してからモデルの実行環境を構築するというので構わないのですが、そのタイミングで実行環境を考えるのでは遅すぎます。ゴール設定と同じぐらい早い段階で、顧客のビジネスに合わせてどのようなモデルが運用できるのかを考えて、実行環境のフィジビリティスタディをしておくことが重要です。その際には必要なデータが集められるかも問題となりますが、それ以上にデータで表現できないような運用制約がないかを洗い出しておくべきです。
たとえば商品配送の実務上の制約は北海道と沖縄とではかなり違うはずです。気候も違えば、ビジネス環境も、風習や文化も違う。本部の分析推進部署に話を聞いても本当のところはわかりません。現場の人だけが認知している制約というものが存在していることがあり、実務に落とし込む上では彼らへのヒアリングが重要になってくると思っていますが。こういった取り組みを抜きにしてモデルを作れば、必ず手戻りが発生するか、運用できないので使われないということになります。
櫻井 「ビジネス理解」の重要性ということですか。
辻 ビジネス理解といってもいろいろあると思うのです。顧客のビジネスドメインや競争環境を知るというレベルもあれば、店舗ごとのオペレーションを知るというレベルもあります。オペレーション理解はビジネス理解でもかなり深いレベルだと思いますが、そこまで理解しないと最適なモデルは作れないし、システムの運用もできません。
原 実際にシステムを使ってもらって初めて様々な制約が見えてくるという面もあります。そのたびに改修することになりますが、ある程度の試行錯誤はやむを得ませんし、むしろそれを丁寧にやることが、ビジネスに寄り添ったシステムを作るための肝だと考えています。
辻 「これってそもそもデータサイエンティストの仕事なの?」と思うことがよくあります。運用のフィジビリティを考える際に、データサイエンティストの参画はもちろん必要ですが、データサイエンティストだけが膨大な工数を割くのは疑問です。そうした背景もあり、コンサルティング部隊がブレインパッドにもできたと理解しています。
櫻井 顧客がビジネスで何を目指していくのか、顧客の前提条件・制約条件の中でどうやってビジネス成果に結びつけていくのかを整理するのがコンサルタントの役割。コンサルタントの整理を踏まえて、何を使って問題を解決するのか、どうすれば効果が最大になるのか、データからどのような示唆を導いていくのかを考えるのがデータサイエンティストの役割というのはイメージしやすいですね。
櫻井 データ分析に取り組む企業が意識すべきことはなんでしょうか。
辻 事業部ごとにデータを扱えるレベルが違っており、中には社内の人間ですらアクセスできないデータもあります。
先ほどデータ定義書の話が出ましたが、これは事業部ごとに存在していて、それぞれの内容やバージョンが微妙に食い違っていることもあります。ある事業部から提示してもらった定義書を基に進めていたら、本番運用では共通基盤のデータを使うことになり、中身を見たら違うので作り直し、といったこともありました。
データサイエンティストは、顧客企業の業務を100%理解しているわけではないので、現場の人が見たらわかる違いを区別できないことが多いのです。ある地域では都道府県レベル、ある地域では市区町村レベルとデータの粒度が違っていてもわからないことがあります。したがって顧客企業側に、データの品質に最終責任を持つ人がいて、その人が責任を果たしてもらうことが大切なのです。
原 私は川中に位置する某卸企業と一緒にサプライチェーンの最適化に携わっているので、自社だけでなく川上や川下のデータ、つまり他社が持っているデータも必要とします。ただ、データを提供する側からすると、自分たちのメリットがきちっと説明されない限り協力しようという気にはなりません。これは、社内データを収集する場合とはまた違った難しさです。これを成功させるためには、関係各所が足並みを揃えて取り組める体制を整えることが重要となります。
崎山 データサイエンティストといえば、様々なアルゴリズムを駆使して高度なモデルの精度を高めていくイメージがありますが、モデル作成以前にいろいろと問題が横たわっているのですね。
原 モデルやアルゴリズムを考える上で必要となるビジネス要件は、お客様に聞かないとわからない部分が多いのですが、お客様も完全に理解しているわけではないので、調査をお願いすることが多々あります。そこを面倒くさがらずに詰めていかないと、結局手戻りが発生するので、どうしても擦り合わせに時間が掛かります。
辻 ツールで解決できる部分も出てきていて、以前よりは効率的にはなっていますね。
櫻井 モデルを作成するツールやデータを可視化するツールはかなり使えるようになってきましたが、データを集めるツールについてはどうでしょうか。
辻 ツール以前に組織的な問題があるように思います。DX推進室のような中央集権的な組織がデータを集中的に管理すれば一見できそうな気もしますが、いろいろな事業部から大量の問い合わせが来てパンクするのが現実でしょう。よく言われる解決策としては、各事業部のコアなデータはその事業部がオーナーになり、データカタログやメタデータなどデータインフラの管理はデータスチュアートが行うというものです。この方針で混沌とした状態から徐々に秩序化されていくのではないかと思います。
崎山 データが管理されているか、定義書が信頼できるか、データの粒度が揃っているか、データ品質の担保ができているか、アクセス権が適切に付与されているかなど、チェックすべきポイントがいろいろと出てきました。
これらのポイントはまさしくデータガバナンスが取り扱っている領域になります。そこで改めて伺いますが、データサイエンティストは「データガバナンス」をどう捉えているのでしょうか。
辻 データガバナンスという言葉は、比較的最近言われるようになったと感じます。それまであまり言われてこなかったのは、データガバナンス的な部分に関しても、データサイエンティストやデータエンジニアが暗黙的に役割として担ってきたからではないでしょうか。それが先ほども言ったように、データサイエンティストだけではデータ分析プロジェクトが回らなくなってきたので、組織的に解決しよう、役割を分担していこうということになりました。そこで役割につけた名前が「データガバナンス」だというのが私の肌感的な理解です。
一方で、解くべき問題や求められる成果が高レベルになるにつれて、データサイエンティストがシステム保守・運用のケイパビリティを十分に有するわけでないことがわかってきたのと同様、データガバナンスに関してもケイパビリティを十分に有するわけではないということも見えてきたのだと思います。今後データを活用していくことが社会に本格的に普及していく上で、データに関することはデータサイエンティストに何もかも任せてしまうというのはかえって危険ということです。そこでプライバシー等も含めて適切なデータ管理ができるアーキテクチャーを構築する専門人材が必要であり、その人たちにデータガバナンスを担ってもらうことにしようということになったのでしょう。
原 辻さんの言うとおり、データガバナンスをどう実現するかを考えることが非常に重要だと考えています。データが企業にとってますます必要不可欠な存在になるにつれ、データガバナンスの考え方が、会社の上層部だけでなく、実際にデータを利用する現場にまで浸透する必要が出てきています。データ分析をビジネス価値に繋げていきたいと本気で考えるのであれば、データガバナンスをどうやって全社に浸透させるかについて企業側はもっと注力していくべきだと考えます。
櫻井 データサイエンティストだけがデータを見ていた時代は終わり、社内の至る部門でデータ活用が進んでいく時代になりました。だからこそ企業にあるデータがいつでもどこでも利用できる状態を準備するデータガバナンスがとても大切だと、私たちも考えているわけです。
さて、会社全体でデータガバナンスに取り組まないといけないといった背景の中、私たちがお客様に説明する際には「攻めのデータガバナンス」と「守りのデータガバナンス」のバランスが取れた「攻守一体のデータガバナンスフレームワーク」というものを掲げています。
このフレームワークには6つの観点があり、守りに関する観点が戦略と統制/管理、攻めに関する観点が組織/人材・プロセス・技術・品質となっています。
データ自体は会社の資産ですから、その使い方や管理のポリシーや様々なルールで守らなければなりません。しかし守っているだけではビジネス価値は生まれないので、それを現場のユーザーにどう使わせる/どうやったら使ってもらえるといったことも考える必要があります。それが攻めのガバナンスで、組織/人材・プロセス・技術・品質のどの観点もどう使わせる/どうやったら使ってもらえるということを軸に考える必要があります。そういった考察が可能なフレームワークとなっています。
以上を踏まえてもらった上で、データサイエンティストにとっての「攻めのデータガバナンス」とはどういうものになるでしょうか。
原 今まで以上にデータから効率よく価値を導き出すには、どういうデータをどういう形で集めていけばいいか――という発想の下で進めていくのが攻めのガバナンスという理解でいいのでしょうかね。そうであれば、私たちがより迅速に、より価値の高い分析ができるようになるために必要不可欠なことだと言えます。
たとえば、単純なことですがデータの履歴をきちっと残すだけでも、分析の準備の手間を減らし、得られる成果を大きくしてくれます。こういう単純だが効果が高い取り組みの観点は、データサイエンティストの経験を基にいくらでも提供することができます。他の専門家と意見交換しながら、攻めのガバナンスを高度化していくための貢献ができると思います。
辻 DXが本格化していくのであれば、データサイエンスによって経営における意思決定の良し悪しを可視化する方向に進んでいくことが求められるでしょう。
その意思決定の中には、マンパワーでできなかった高度な業務を新しく始めることも含まれており、その業務を実現するためにどのようなデータを集めていくか、そしてそれができる人材をどのように採用し育成するかも含まれます。こういったこと全体が「攻めのデータガバナンス」なのだと私は理解しました。
だとすれば、データガバナンスを担う人材を今後増やしていくことが、DXの進展とそれに伴う社会全体の生産性向上に寄与するのではないかと思う次第です。
崎山 ビジネス成果に結びつくことを考慮したデータガバナンス整備の重要性が取り沙汰されるようになってきましたが、このこと自体は良い傾向だと考えられます。なぜならデータガバナンスの整備が進むにしたがって、データの品質が担保されると同時に正しいデータの定義がすぐに参照できるようになり、迅速に価値ある分析が可能になるからです。言い換えますと、データガバナンス、特に攻めのガバナンスは、データサイエンティストの力を最大限に発揮してもらうことに大きく貢献するということです。
櫻井 データサイエンティストに求められることは、ビジネス成果に結びつく分析結果を出すことです。社会が複雑になりどんどん不確実になる中、ビジネス成果を出すためにさらにデータサイエンスが必要になってきました。そのためデータサイエンティストには、できるかぎりデータサイエンスに注力してもらいたい。しかしながらデータサイエンティストもサイエンスだけに囚われて、自分の好きなアルゴリズムを追求していくだけではなく、ビジネス成果に結びつく「攻めのアルゴリズム」を探求してもらいたいです。
そして、ビジネスで成果を出すという目的が今回参加した全員で共有されていると感じました。今後もこの目的のために、私たちはデータサイエンティストが最大限に力を発揮できるデータガバナンスを提供していく所存ですし、データサイエンティストのみなさんもその中で最大限のビジネス価値の実現に力を発揮していけるのではと思いました。
今日はありがとうございました!
第4回では、DX関連案件の上流フェーズでのコンサルティングを担当している、ビジネス統括本部 データビジネス開発部でディレクターを務める神野雅彦が、同本部の管掌役員である取締役の関口朋宏、同本部長の西村順を招き、データ活用やデータガバナンスに関して、これまでの変化と企業が抱える課題を将来的に解決していくのかという視点から語ります。
【データガバナンスに関連する記事】
データガバナンスとは?データ管理体制の重要性
この記事の続きはこちら
【シリーズ】データガバナンスがもたらすもの-第4回 組織組成・人材育成とデータガバナンス(前編)
あなたにオススメの記事
2023.12.01
生成AI(ジェネレーティブAI)とは?ChatGPTとの違いや仕組み・種類・活用事例
2023.09.21
DX(デジタルトランスフォーメーション)とは?今さら聞けない意味・定義を分かりやすく解説【2024年最新】
2023.11.24
【現役社員が解説】データサイエンティストとは?仕事内容やAI・DX時代に必要なスキル
2023.09.08
DX事例26選:6つの業界別に紹介~有名企業はどんなDXをやっている?~【2024年最新版】
2023.08.23
LLM(大規模言語モデル)とは?生成AIとの違いや活用事例・課題
2024.03.22
生成AIの評価指標・ベンチマークとそれらに関連する問題点や限界を解説