メルマガ登録
近年、新たな学び直し=リスキリングという言葉がバズワード化しており、特に日本においては、IT・DX人材の慢性的な不足から、リスキリングによる、「データ解析・データ分析」ができる人材=データサイエンティストの確保が注目されています。
▼リスキリングの意義などをより深く知りたい方はこちらもご覧ください。
なぜ今「リスキリング」が必要なのか?DX時代に生き残るための、人材育成の考え方と3つのステップ
そこで、異業種からデータサイエンティストへとジョブチェンジを果たしたブレインパッドのメンバーに声をかけ、「リスキリング×データサイエンティスト」を存分に語るシリーズを企画しました。
【関連記事】
【社員が解説】データサイエンティストとは?仕事内容やAI・DX時代に必要なスキル
ブレインパッド代表の高橋が代表理事を務める、一般社団法人データサイエンティスト協会では、データサイエンティストに必要なスキルを「ビジネス力」「データエンジニアリング力」「データサイエンス力」と定めています。本記事では、特にこの3つのスキルをどのようにして身に着けたのかに焦点を当てました。
シリーズ第2回となる今回は、SIerのITエンジニアからデータサイエンティストへ転身した、アナリティクス本部アナリティクスサービス部、中道亮介さんです。
連載記事
■登場者
2020年3月に株式会社ブレインパッドに入社。前職は大手SIerにて8年ほど勤務、オンプレ基盤構築やシステム開発業務に携わる。株式会社ブレインパッドにおいては、ネット業界における広告
の分析・配信シミュレーション、金融業界の法人分析・需要予測・自然言語の分析などのプロジェクトに携わる。
データサイエンティストの中道亮介です。ブレインパッドに入社して4年目になります。前職では大手SIerに8年間在籍し、金融機関向けのシステム開発・運用に従事してきました。お客様の要件をヒアリングする上流工程から下流工程までを経験し、プロジェクト管理業務を主に行っていました。
転職前に漠然と感じていたのは、お客様の要求通りのシステムを開発すること自体は当たり前のことになってきており、SI業界も私自身も、このままでは価値が下がっていくのではないか、ということでした。
こうした課題感の中、AIが普及してきました。しかし当時はまだ特定の分野で適宜利用されている段階で、システムへの組み込みやビジネス活用という意味では進んでいませんでした。
そこで、SIerにも、そこで働く技術者にも、AIのシステム組み込み、および運用に活路があると考えたのですが、本格的なAI案件の引き合いは、私のような業務システムの開発・運用を担当している技術者のところには訪れませんでした。
昨今、企業での内製化が進んでいます。その中で、データを蓄積する仕組み作りができている企業は増えていますが、「データの活用」や「データ活用を見越した上手なデータ蓄積」ができている企業はまだまだ少ないと思っています。
そこで、システム開発による価値提供ではなく、「データ活用」による価値提供に自身の軸を移すことに決めました。そのために独学でAI技術を学ぶことはしていたのですが、理論と実践が結びつかず、実業務上でのAI技術を身につけていきたいと思い、データサイエンティストにキャリアチェンジしようと考えました。
幅広く、深く専門知識を有するデータサイエンティストが多く在籍し、その元で実業務上でのデータサイエンス経験を積むことができ、さらに「データ活用」による価値提供の実現までできたらと考えていました。これらを叶えることができる会社を探したところ、ブレインパッドがピッタリ当てはまりました。
AIに関しての業務知識はキャリア上まったくなく、ゼロからの転身でしたが、幸い受け入れてもらうことができました。プロジェクトマネジメントおよびシステム運用・保守に強みがあるところを認めてもらえたのだと思います。
SIerからブレインパッドに転職するときに考えられた職種としては、データサイエンティストの他に、データエンジニアや機械学習エンジニアなどもありました。前職を考えるとデータエンジニアが最適とも思ったのですが、データサインティストを目指したのは、ただデータ分析に関わるだけでなく、分析結果をビジネス価値創出や社会貢献につなげることにやりがいを感じたからです。
「30代になってデータサイエンティストに転身した」というと苦労したのだろうと想像されがちですが、何もわからなかったことでかえって楽に取り組めました。というのも、わからないことはまず自分で調べたうえで、メンバーや上司に聞けば何でも教えてもらえる環境があったからです。私自身、知らないことを聞くことは恥と思わない性格で、それも幸いしました。ブレインパッドのみなさんも、1つ聞けば10も20も教えてくれる人ばかりで、助けられています。また社内勉強会も盛んで、積極的に参加させてもらっています。ブレインパッドの互いに教え合う文化は強みの1つだと思います。
学び直したことも多かったです。前職では外注管理を含むマネジメントが主な仕事でしたので、SQLのレビューはできても、自分でいちから書くのはあまり得意ではないという、技術レベルとしては中途半端な状態でした。
Pythonもほぼ独学で知識をつけましたから、ちょっと業務で使ったことがあるという程度で、これもいちから勉強し直しました。
その他にもデータサイエンスに必要な統計学も基礎から勉強しました。実践で身につけようとKaggleにも参加しました。いろいろ勉強しましたが、データサイエンスが肌に合っていたのか、まったく苦ではありませんでした。
ある程度勉強が進んだところで、わからないテーマがあれば、自ら勉強会を主催するようになりました。前述したようにブレインパッドは社内勉強会が盛んなのですが、私のような入社間もない社員が呼びかけてもメンバーが集まってくれます。これは前職ではあまり考えられなかったことで、ブレインパッドに入ったからできたことだと思います。
転職してから学ぶこと自体に苦労はあまり感じなかったのですが、業務系のITエンジニアの「システム開発脳」とデータサイエンティストの「データ分析脳」のギャップに、初めのころは戸惑いました。
感じたギャップは、主に以下の3点です。
(1)データの持ち方や残し方
(2)品質観点
(3)データを疑う
「システム開発脳」では、データベースのテーブルを作成する際、トランザクション系のアクセスログテーブルには日時などのアクセス情報とユーザIDのみにし、ユーザIDに紐づくユーザ情報は別のテーブルにユーザマスタテーブルとして疎結合にデータを保持します。使用時には1つの大きなクエリで一気に結合することが多いです。これは、同じ情報を複数のテーブルに持たせないことでデータ量の省力化や、データ更新時の複数テーブルへの反映を防ぐ効率化などのために実施しています。
「データ分析脳」では、データマート前の中間テーブルでも非効率な(ユーザIDでユーザ情報を結合した状態など)データの持ち方をすることが多いです。これは、当初の仮説以外の観点もあとから柔軟に集計・再活用できるよう、分析作業の効率性を意識しているために実施しています。
「システム開発脳」では、各テーブルから1つの大きなクエリで結合・抽出することが多く、そのクエリの品質については、細かいテストを実施して担保しています。
「データ分析脳」では、中間テーブルなどにあえて非効率なデータの持ち方をすることで、途中の処理の確からしさを確認できるようにすることが多いです。例えば、最終的にひと月の集計値を出す場合に、中間テーブルとして日ごとのデータでの集計値を出しておきます。この中間テーブルを見れば、10日のデータがない、日ごとに大きな偏りがあったなど、ひと月の集計値を一気に出しただけでは見落としかねない誤りや傾向を見つけることができ、分析の品質が向上できます。
「システム開発脳」では、テーブル定義書に定められた通りのクリーンなデータが入っていることが前提になり、品質の良いデータが入力されていると疑わないことが多いです。
「データ分析脳」では、そもそものデータの品質を信用しない、疑うことが多いです。分析に用いる前にデータの成り立ちから理解し、クレンジングしたり、偏りがないように調整したりしないといけません。
お客様が分析用にとご用意くださり渡してくださるデータは、残念ながらいい加減なものが多いと思っておくに越したことはありません。CSVファイル形式でもらえればいいほうで、Excelデータのファイルが渡されることもあります。データ以外の文字列もたくさんありますし、セルが結合されていてデータがそのままでは処理できないことも多いです。
これら3つのギャップについて、今となっては当たり前のことですが、最初はかなりの衝撃を受けました。
(1)(2)については、当初の上司から指摘され、「システム開発脳」になっている私とはギャップが大きく、理解できるまで時間がかかったことを覚えています。
(3)については、データを分析用に蓄積できるよう提言することもデータサイエンティストの仕事ですが、とても分析用とは言えないデータを地道に整理するのもデータサイエンティストの仕事なのです。データサイエンティストになってから思い知った事実でした。
私だけかもしれないと思っていたのですが、最近SIerからブレインパッドに転職してきたメンバーも「システム開発脳」だと感じたことがありましたので、この「脳」の話は、私と同様のキャリアチェンジを考えている人に有効なアドバイスかもしれません。
SIerのエンジニアからデータサイエンティストに転身したいと考えている人に、もうひとつアドバイスさせていただくとすれば、私たちには初めからデータサイエンティストとしてキャリアを積んできた人にはない強みがあることです。
データサイエンティストに必要な力として、データサイエンティスト協会では、ビジネス力、データエンジニアリング力、データサイエンス力の3つの力を定義しています。(図)。
このうち、データサイエンス力は、もちろんあればあるほどよいのですが、SIer出身者では、長年データサイエンティストをやってきた人にはなかなか勝てない部分でもあります。それが理由でデータサイエンティストになることをあきらめる人も多いかもしれません。しかしデータエンジニアリング力であれば勝っているSIerの技術者は多いでしょうし、業務システム開発に要件定義や提案段階から関わってきた方なら、ビジネス力も引けを取らないでしょう。このように、データサイエンティストとしての総合力で考えれば、SIer出身の元エンジニアが活躍できる分野だと言っていいと思います。
また、これは今後変化すると思いますが、現時点で10年以上データサイエンティストを続けている人は、アドホックな分析経験のほうが多いのです。そのため、保守用のドキュメントをしっかり作るとか、段階を追って設計をしていくとか、大きなプロジェクトをマネジメントしていくなどといったことは、SIer出身の元エンジニアのほうが一日の長があると感じます。
私以外にもSIerからブレインパッドに入社しているメンバーが何人もいますが、ビジネス力とデータエンジニアリング力がかなり強い人が入ってきているように思います。もちろんずっとデータサイエンティストだった人たちもビジネス力とデータエンジニアリング力を着実に身につけてきています。3つの力が最初から全部優れている人はまずいませんので、自信をもってチャレンジしてみてよいと思います。
データサイエンティストに求められる能力として、①ビジネス力、②データエンジニアリング力、③データサイエンス力の3つの力があると述べました。どれも業界最高レベルになれればそれに越したことはありませんが、なかなかそうもいきません。
例えば、弱点がなく、尖っている能力がある状態を目指すところだとすれば、私はビジネス力を尖らせていきたいと考えています。その前提で、それぞれの力をどのように身につけてきたか・身につけているかを少しお話しします。
この数年、お客様と直接会話をしていく中で、自分でも著しくビジネス力が伸びたと感じます。これはすなわち、お客様と快適に会話をすることがビジネス力も伸ばしてくれたと捉えており、まずは笑顔とユーモアでお客様と笑い合うことを心がけています。そうすると信頼関係が自ずとできあがり、より深い相談をしてもらえるようになり、ますますビジネス力が向上する――という良い循環が生まれることになります。
もちろん交渉術などいろいろなテクニックもありますし、ドメイン知識も必要ですが、それ以上にお客様を第一に思う気持ちのほうがビジネス力の向上には大切だと考えています。
ドメイン知識を身につけるには、本などから情報をインプットすることも重要ですが、お客様から徹底的にヒアリングすることも重要です。新人のデータサイエンティストにわからないことを聞いても恥ずかしくないのと同じく、お客様の業務でわからないことがあれば、お客様自身に聞くことはまったく恥ずかしいことではありません。そのためにもまずは信頼関係を作って、何でも聞けるようにしておくことが重要なのです。
前職でアプリ・インフラの両方を幅広く担当していたことと、開発だけでなく保守・運用も手掛けてきたので、ベースの幅広さとしては申し分ないと自負しています。ただ、データサイエンスのためのデータエンジニアリング力となると、まだまだ勉強すべきことはあります。たとえば、最近注目されてきているデータマネジメントを実現するためのプラットフォームやMLOpsに特化したテスト手法などは現在勉強しているところです。ただ、基礎はあるので吸収も早く、プロジェクトでの成果を社内に展開していくといったところで貢献もできているかと思います。
日々最も時間を使って勉強しています。現在従事している金融機関様の案件では、客先への出社が求められているので、通勤時間を勉強時間に充てています。帰宅してからも仕事に支障が出ない程度に勉強していることもあります。業務で関わる技術についてはもちろん、これからもっと使われていくと予測されるが、まだ業務では関われていない最新技術も怠りなく勉強するようにしています。このような技術については、雑談の中でお客様から尋ねられることもあるので、できるだけ早くキャッチアップするよう努めています。
最初はあるプロジェクトにメンバーとして参画し、代理PM(プロジェクトマネージャー)まで務めました。現在はある金融機関様の支援プロジェクトの1つでPMを努めています。このプロジェクトの目的は、分析組織の立ち上げ支援で、私がプロジェクトに入ったときには、組織としては既に立ち上がっていましたが、ビジネス効果をより追求していくという段階に来ていました。私が入る段階でブレインパッド側のメンバー数が2名から5名になりました。
一般的に、データサイエンティストの仕事はデータ分析の示唆出しまでだと思っている人が多いと思います。しかし私たちもそうですが、弊社がご支援している多くの企業様も、データサイエンスをビジネス活用して価値を出してこそ、データ分析の意味があると強くこだわられていると感じます。
世の中ではPoCで終わる案件がまだまだ多い中、ブレインパッドは、実際にビジネス適用するところまでどうしたら近づけるかを、お客様と一緒に粘り強く考えることに一生懸命です。あくまでビジネス効果を出すという目的を遂行するために、PMとしてメンバーのデータサイエンティストに適切に作業を振りながら、進捗や品質を管理し、適用に近づけていくのが私の仕事です。
アドホックな分析もあるのですが、最近では定期的に繰り返し行うデータ分析やデータ活用も増えてきています。定期的に分析するということはもちろんビジネス目的になりますから、投資対効果が求められます。そこは私のSIer時代の経験がものを言うところです。
例えば、データ分析の結果から、毎月の営業リストに優先順位をつけるという案件がありました。データサイエンスの観点で言えば優先順位の精度が問題になりますが、システムの観点で言うと、そのリストをどうやって営業パーソン一人ひとりに毎月低コストで確実に配布するかも含めて考えることが重要です。むやみにシステム化するとコストがかかるわけで、「月1回しかリストを配布しないならメールで配ればいい」、といった判断も必要です。ところが実際にシステムの運用をしたことがないと、すぐシステム化すればいいというようなことを提案してしまいがちなのです。コストの観点が抜け落ちる場合があるのです。
あるいは機械学習モデルの改善運用についても同様のことが言えます。効率化も大事なのですが、効率化しすぎると今度は学習用には適切ではないデータばかりになってしまい、モデルの改善に役立たなくなります。そのあたりのバランスも考えて運用を設計する必要があります。その他、システム開発でよく出てくるRASIS(コンピュータシステムに関する評価指標の一つで、「Reliability=信頼性」「Availability=可用性」「Serviceability=保守性」「Integrity=保全性」「Security=安全性」の5項目)の観点で考えることが有効だったりします。こういったことは、やはりSIer出身者の強みが発揮できる分野であり、だからこそ任せてもらえるのだと思っています。
データ分析が民主化されていく中、高度な分析力の価値はなくならないでしょう、ただデータを分析するだけのことであれば、その価値は減少すると考えます。その分ビジネスやシステム運用に関するスキルの価値が高くなってきていることを実感しています。
データサイエンス関連の学部が増えており、大学生がデータサイエンスを学習する機会が増えたことで、若手の方々のデータサイエンス力がこの数年で著しく向上していると感じます。その分、逆に言えばデータサイエンス力だけでは戦えなくなっているということを意味し、ビジネスで価値を出していくことへのこだわりを、少なくともブレインパッドに入社する新入社員には、仕事の中で感じ取ってほしいと思っています。
また私自身は、データサイエンスでわからないことがあれば、ためらいなく新入社員のデータサイエンティストにも聞いています。全然恥ではないですし、彼ら彼女らは十分な知識も能力も持っているからです。大学時代に勉強してきた努力に対し、大変尊敬していますし、敬意をもって接するようにしています。私も提供できる知識があれば惜しみなく提供することで、相手が新入社員であろうとも、持ちつ持たれつ対等に知識や情報を交換することを心がけています。
前職では、「新人には手がかかる」というネガティブなカルチャー・意識もあったので、ブレインパッドのリクルート能力が高いのかもしれません。もちろんブレインパッドの新入社員でも手がかかる部分はありますが、それに見合うだけの能力を発揮してくれていると感じていますし、驚いてもいます。
最初に自分がメンバーとして入ったプロジェクトでは、本記事のシリーズ第1回を執筆された中山さんがPMでした。中山さんからいろいろと教わったのも、今の自分のデータサイエンティストとしての仕事の向き合い方への影響は大きかったと思います。プロ意識が強いなあと尊敬している方で、前述したデータに関する「システム開発脳」と「データ分析脳」の違いも、中山さんとの会話の中で気づいたことでした。中山さんにすれば基礎中の基礎のような話だったでしょうが、ブレインパッドに入社してすぐ、それに気づけたことは、とても貴重な経験だったと感謝しています。
SIerにいたときは、ゼロからいろいろ教えてもらいました。ところがデータサイエンティストの世界では共通かもしれませんが、中山さんの教え方は、1か2までは自分で勉強させ、そこからわからないことがあれば教えてくれるというやり方です。それも直接手取り足取りではなく、何ができていないか、どういうスキルが足りていないか、どんな本を読めばいいかなどを教えてくれるのです。あと、たぶんこれは教育的配慮だと思うのですが、類似業務をいくつかやらせていただけたのも訓練になったと感謝しています。その経験からデータを粘り強く確認する癖がついたと思っています。
私の場合は、大学で数学を学んでいたこともあり、データサイエンス力の中でも基礎的な統計などはすんなり身につけることができました。もちろんそれだけではデータサイエンスにはならないのですが、そもそも自分の発想は理系的だと思っています。
PMとしての仕事の取り組み方にしても、私の場合は運用効率やシステム連携の方式の是非、データサイエンスとしての是非など理系的な指摘や提言が多いと感じます。
一方で、現在従事している金融機関様の別の案件のPMは、「プロジェクトのそもそもの目的は何でしたっけ?」という原点回帰的な考え方だとか、お客様との折衝など人的なスキルに優れ、私には無い感覚も多く感じます。
【関連】
データサイエンティストと聞くと理系出身者でないと中々なれないという誤解もあるかもしれませんが、前述の中山さんも前職は公認会計士でしたし、大学の専攻が数学や統計学でなかったからといってあきらめる必要はないと考えます。繰り返しになりますが、データサイエンティストには①ビジネス力、②データエンジニアリング力、③データサイエンス力3つの力が求められますが、どの順番で身につけていってもいいわけですから、文系の方はまずビジネス力を磨けばいいと思っています。
私の目標は、自分自身の技術を磨くよりも、自分の持つ技術・能力で社会に貢献することです。お客様と同じ方向を見ながら一緒にビジネス価値を創り出せるデータサイエンティストになることを当面の目標にしています。その上で、最終的にはデータサイエンスに強いコンサルタントになりたいと考えています。問題解決が主であり、データサイエンスはそのツールであるという考え方です。
そこで、今後鍛えていきたい力は、分析案件そのものの企画力であったり、さらに高度なプロジェクトマネジメント力や、お客様の発想も膨らませられるような発想力、経営者を動かせるような説明力や熱意など、より高次のものになります。
実際に仕事をしていると、分析の企画段階で「それは無理じゃない?」とお客様に躊躇されてしまうこともあります。しかしチャレンジしないとわからないことも多く、お客様に「リスクを取りましょう」という説得をしないといけない局面もあるのです。その際にお客様の理解不足でチャレンジできないのであれば、それはまさに機会損失になりますので、成功イメージを細かく具体化して、お客様に理解いただけるようにしないといけません。これをしっかりできるデータサイエンティストになることを現時点では目指しています。
繰り返しになりますが、お客様との親密度および信頼度の向上は大切なことであり、その点に関する私の強みを今後も活かしながら、お客様と一緒に成長し続けていきたいと考え、日々精進しています。
あなたにオススメの記事
2023.12.01
生成AI(ジェネレーティブAI)とは?ChatGPTとの違いや仕組み・種類・活用事例
2023.09.21
DX(デジタルトランスフォーメーション)とは?今さら聞けない意味・定義を分かりやすく解説【2024年最新】
2023.11.24
【現役社員が解説】データサイエンティストとは?仕事内容やAI・DX時代に必要なスキル
2023.09.08
DX事例26選:6つの業界別に紹介~有名企業はどんなDXをやっている?~【2024年最新版】
2023.08.23
LLM(大規模言語モデル)とは?生成AIとの違いや活用事例・課題
2024.03.22
生成AIの評価指標・ベンチマークとそれらに関連する問題点や限界を解説