生成AI/LLM技術最新トレンド｜①47都道府県の課題を生成AIで解決するGoogle・松尾研の構想 ②NVIDIAが大規模言語モデルのトレーニング用合成データ生成パイプラインをリリース ③ハルシネーション発生率をRAGの1/10に抑えるファインチューニングベースの手法の提案

生成AI/LLM

執筆者

崎山栞里

公開日

2024.07.10

更新日

2024.09.04

生成AI/LLM技術最新トレンド vol.8 株式会社ブレインパッドアナリティクスコンサルユニット崎山栞里

みなさんこんにちは。アナリティクスコンサルティングユニットの崎山です。

2022年にChatGPTが登場して以来、LLM（LargeLanguageModels、大規模言語モデル）、およびGenerativeAI（生成AI）に関する技術革新が日々進み、それを取り巻く社会情勢もめまぐるしく変化しています。

これらの技術の社会実装に向けた取り組みや企業への支援を強化するため、ブレインパッドでもLLM/生成AIに関する技術調査プロジェクトが進行しており、最新トレンドの継続的なキャッチアップと情報共有を実施しています。

本連載では、毎週の勉強会で出てくるトピックのうち個人的に面白いなと思った事例・技術・ニュースをピックアップしてご紹介していきます。
※本記事は2024/6/20時点の情報をもとに記載しています

本記事の執筆者

コンサルタント

崎山栞里

SHIORI SAKIYAMA

会社

株式会社ブレインパッド

所属

アナリティクスコンサルティングユニット

2021年新卒入社。コンサルタントとして、商社のBPR支援や金融業界の新規事業構想策定を実施。現在は生成AIの活用に向けた研究・開発プロジェクトに従事。

1. 47都道府県の課題を生成AIで解決するGoogle・松尾研の構想

6月19日に開催された「Google for Japan 2024」にて、GoogleからAIを活用した新たな取り組みが発表されました。

その中で、東京大学の松尾・岩澤研究室（松尾研）とパートナーシップを締結し、2027年までに47都道府県における地域課題の解決をサポートする生成AIモデルの実装と、AI人材の育成を支援する取り組みを発表しました。
取り組みの第一弾として大阪府における雇用マッチングに生成AIを活用する取り組みが紹介されているほか、今後広島県から取り組みを始めるとのことです。

少子高齢化・労働人口減少が進む近年、限られた労働者1人1人の生産性向上やそれらを通じた企業の競争力向上が日本社会における喫緊の課題になってきています。
こういった課題に対し、日本のAI研究最先端の研究室と最高峰のテック企業、地方自治体が産官学で連携して取り組んでいくというのは明るいニュースだと思います。続報に期待です。

出典：https://blog.google/intl/ja-jp/company-news/technology/ai-google-for-japan-2024/

2. NVIDIAが大規模言語モデルのトレーニング用合成データ生成パイプラインをリリース

NVIDIAは6月14日、Nemotron-4 340B という新しいオープンソースのLLMモデルを発表しました。これは、人工知能（AI）をトレーニングするための合成データを作成するためのモデルです。

合成データ生成パイプライン「Nemotron-4 340B」 — 図出典：https://research.nvidia.com/publication/2024-06_nemotron-4-340b より引用

ここで述べられている合成データとは、現実世界のデータの特性やパターンを模倣しアルゴリズムを用いて人工的に生成されたデータです。
AIのトレーニングには大量の良質かつ堅牢なデータが必要ですが、これらを実データだけで集めきるには非常に時間やコストがかかります。合成データを用いることで、大量かつバラエティに富んだデータを簡単に生成でき、また実データではないためプライバシーの懸念なども軽減できます。

【関連記事】合成データでLLMを学習する際のベストプラクティス発表

Nemotron-4 340B の良いところは、単に高品質で多様な合成データを合成できるところだけではありません。
Nemotron-4 340B は、生成された合成データの品質を評価し、助けになるか・正確さ・一貫性・複雑さ・冗長さの5つの観点でフィルタリングします。これにより、データの品質を向上させることができるのも利点の一つです。

また、ライセンスは「NVIDIA Open Model License Agreement」ですが、基本的にOSSと同等の許容度で、このモデルを用いて作成された合成データを他のLLM開発に使っても良いという太っ腹っぷりです。

モデル自体の性能評価も高く、モデルの性能比較サイト「Chatbot Arena」ではMeta社のオープンソースモデル LLaMA-3 70B-Instruct と同等の性能を発揮していることがわかります。

図出典：https://chat.lmsys.org/?leaderboard のスクリーンショットを筆者加工

モデルはオープンソースで公開されており、すでにHugging Face上でアクセスすることができます。興味がある方はぜひご覧ください。

【参考】Nemotron 4 340B

出典：https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/

3. ハルシネーション発生率をRAGの1/10に抑えるファインチューニングベースの手法の提案

AIが事実に基づかない情報を生成する現象のことを「ハルシネーション」といいます。
このハルシネーションの軽減のために、RAG（検索拡張生成、Retrieval Augmented Generation）などの既存手法では外部の知識を参照させることで対応させようとしていました。

【関連記事】プロンプトエンジニアリング手法　外部データ接続・RAG編

RAGを用いたハルシネーションの抑制は手軽かつ安価に始められる反面、精度が検索の性能に左右されることや、実際にはハルシネーション自体の抑制には不十分であることが指摘されています。

今回ご紹介する「Lamini Memory Tuning」は、RAGを使わずにハルシネーション発生率をRAGの1/10にまで抑えたファインチューニングベースの手法となります。概要をご紹介します。

今回Laminiが提案する Lamini Memory Tuning は、既存のLLMを LoRA* という専門アダプタを用いてチューニングし、モデルが推論する際にはその巨大なメモリエキスパートの混合（Mixture of Memory Experts。以降MoMEと呼称）の中から最も関連性の高いエキスパートを選択するという方法で生成を行います。

*LoRA（Low-Rank Adaptation）とは：ファインチューニングの手法のひとつで、元のモデルのパラメータを直接変更するのではなく低ランクの行列を導入してパラメータを変更するような手法です。
これにより、AIに対してより少ない計算量で効率よく追加学習ができるのがメリットです。特に画像生成モデルStable Diffusionのチューニングで話題になった手法だそうです。

例えばローマ帝国についてモデルから正確な事実を把握したいのであれば、Lamini Memory Tuning は「カエサル」「水道橋」「軍団」等ローマ帝国に関するエキスパートを選択します。
選択したエキスパートを使ってモデルは特定の事実（今回はローマ帝国）を記憶するために学習します。モデルの推論時には必要なエキスパートのみを用いて出力を行います。

図出典：https://www.lamini.ai/blog/lamini-memory-tuning より引用

結果として、以下のようなユースケースに活用されています。

テキストからSQLへの高精度な変換を達成
ドキュメントの分類で100％の精度達成
レコメンドシステムで商品IDの誤りを減少

また、一部の例ではモデルの出力の精度が50％から95％に向上したとの報告もありました。

この研究の面白い点は2点あります。
1つはハルシネーションの発生率がRAGの1/10にまで抑えられている点です。
2つ目はアダプタ（LoRA）を付けて過学習させているアイディアです。これにより、モデル全体の汎化性能は落とさないまま特定領域に詳しくすることが可能になっています。

今後は Lamini Memomry Tuning を用いたチューニングが一般的になっていくのかもしれませんね。
全ての領域に対して100％正答させることはまだできませんが、特定領域に特化させるには十分な性能を発揮できているように思います。

出典：
https://www.lamini.ai/blog/lamini-memory-tuning
https://github.com/lamini-ai/Lamini-Memory-Tuning/blob/main/research-paper.pdf

まとめ

最後まで読んでいただきありがとうございます。
今回は、47都道府県の課題を生成AIで解決するGoogle・松尾研の構想、NVIDIAが大規模言語モデルのトレーニング用合成データ生成パイプラインをリリース、ハルシネーション発生率をRAGの1/10に抑えるファインチューニングベースの手法の提案の3つのトピックをご紹介しました。

ブレインパッドは、LLM/Generative AIに関する研究プロジェクトの活動を通じて、企業のDXパートナーとして新たな技術の検証を進め企業のDXの推進を支援してまいります。
次回の連載でも最新情報を紹介いたします。お楽しみに！

ビジネスパーソンが押さえておきたい生成AI/LLM技術最新トレンド

【Vol1】OpenAIの日本法人開設…他
【Vol2】Llama3公開、 RAGモデルの信頼性…他
【Vol3】GPT,Gemini,KAN,AlphaFold3など
【Vol4】Grounding DINO 1.5 Pro/Edge公開…他
【Vol5】言語モデル評価のベストプラクティス…他
【Vol6】Googleの AI Overview ハルシネーション防止策…他
【Vol7】RAG手法 MRAG…他
【Vol8】松尾研の構想…他
【Vol9】Claude 3.5 Sonnet リリース,EAGLE-2…他
【Vol10】LLMの長文理解を評価するベンチマーク,LLM-CriticGPT…他
【Vol11】モデルから知識を”忘却”する技術…他
- モデルから知識を”忘却”する技術Unlearningとその限界
- 敵対的攻撃を劇的に減少させるシンプルなアプローチ
【Vol12】GPT-4o mini 登場,スプレッドシートの構造の読み取り…他
【Vol13】OpenAI o1、OpenAI o1-mini発表…他
【Vol14】ストレスレベルがLLMのパフォーマンスへ影響…他
【Vol15】AIが映像を「見て学び」、ロボットに「実行させる」…他
【vol.16】スマホ利用可の高性能AIが登場…他
【vol.17】複数のAIエージェントが協力し合って複雑な作業に挑む…他

このページをシェアする

コピー
しました

この記事に関する
お問い合わせはこちら

あなたにオススメの記事

人気タグから探す

人気記事ランキング

この記事に関連する
おすすめの記事

あなたにおすすめの記事

株式会社ブレインパッドについて

2004年の創業以来、「データ活用の促進を通じて持続可能な未来をつくる」をミッションに掲げ、データの可能性をまっすぐに信じてきたブレインパッドは、データ活用を核としたDX実践経験により、あらゆる社会課題や業界、企業の課題解決に貢献してきました。そのため、「DXの核心はデータ活用」にあり、日々蓄積されるデータをうまく活用し、データドリブン経営に舵を切ることであると私達は考えています。

株式会社ブレインパッド
についてはこちら

メールマガジン

Mail Magazine

データ活用の厳選記事や、会員限定のDXのお得情報などをお届けいたします。

1分で簡単登録！

メールマガジンのご案内