DOORS DX

ベストなDXへの入り口が
見つかるメディア

【後編】「画像認識」技術の変遷と、導入に向けてのポイント

執筆者
公開日
2022.08.18
更新日
2024.02.18

前編はこちら

前編では、画像認識の基礎や歴史、深層学習が与えたインパクト、画像認識の技術動向について述べました。後編ではさらに実用的な視点で、「画像認識技術を導入するにあたり、考慮すべきこと」について述べていきます。

本記事の執筆者
  • データサイエンティスト
    千葉 紀之
    会社
    株式会社ブレインパッド
    所属
    アナリティクスコンサルティングユニット
    役職
    マネジャー
    画像処理に関する多くの案件に従事。近年は機械学習・深層学習の導入支援に積極的に取り組む。 その他、需要予測や広告効果の最適化等にも従事。

画像認識技術(深層学習ベース)を導入するために考慮すべきこと

画像認識は、近年では深層学習の登場・発達によって認識精度が大幅に向上したのはもちろんのこと、幅広い分野での活用が進むようになりました。

汎用的な深層学習ベースの製品も登場し、以前と比較すると、画像認識技術を導入するための敷居も大幅に下がったと言えます。ただし、本当に深層学習ベースの画像認識技術を自社へ導入する必要があるのかよく検討する必要があります

深層学習ベース(一部、機械学習ベースも含む)の画像認識技術を導入するにあたり、いくつかの観点を事前に検討しておく必要があります。代表的なものを以下に示します。

  • 学習を意識した画像の取得
  • 学習データの質と量の課題
  • 品質保証への対応
  • 導入後の運用の考え方

ここでは、ファクトリーオートメーション(Factory Automation: FA)の良品と不良品の判別をする外観検査の用途での導入を例として、上記観点についてまとめます。FAは、古くから画像認識技術を利用して検査自動化の取組みが早くから進められてきた領域です。

学習を意識した画像の取得

FAの外観検査は、例えば自動車の自動運運転やデジタルカメラが顔検出のように実社会の複雑な環境(昼夜、雨、霧など時間帯や天候など)下で実施するものではありません。つまり、撮像環境から検討し構築することで、画像認識に適した画像を取得することができます。同一の対象物を撮像する限り同じ画像になるようにすること、対象物の欠陥を際立たせることのできるように照明を当てることなどを考慮した撮像環境を構築することができれば、特徴量を抽出しやすい、つまり学習に適した画像となります。

このように、モデルの精度向上を目指すのみではなく、業務フローの見直しも含め、それ以外の部分から検討することが重要となります。

学習データの質と量の課題

検証を進めるために必要なデータが揃っていない、データ量が足りないということがあります。検証対象物全体に対して不良品の発生件数は少なく、十分な枚数の画像が集まらないということが起こり得ます。近年では、少量のデータでも高精度な手法がいくつも発表されるなどしています。

  • 研究段階の手法も多いですが、少量のデータでも高精度な手法を試してみます。
  • データを蓄積する仕組みから検討・導入します。例えば精度は落ちるかもしれませんが、ルールベースなどの単純な手法を導入し、運用などでカバーしながらデータを蓄積していきます。当面は判別結果が怪しい曖昧な人の目で検査するといった対応をしながら、蓄積されるデータを利用してAIモデルの精度を高めていきます。

といったように、様々な選択肢が考えられます。

品質保証への対応

特に深層学習ベースの画像認識は、得られた結果に対して、どのような判断がなされたかの根拠がわからない、「ブラックボックス」と呼ばれる問題があります。どのようなプロセスでその結果が導かれたのか相関関係はわかっても因果関係がわからない、わかりにくいという一般論が、FAの場合も同様で、万が一不良品が市場に流出した場合、なぜ判断を間違えたかの要因解析が困難であり、ブラックボックスのモデルは実践に導入しづらいということにつながります。その対応として、以下のようなアプローチなどが考えられます。

  • 画像のどこに注目して推論をしているのかを解析・可視化するためのGrad-CAMなどのアプローチを導入します。
  • 画像認識で処理したいタスクを細分化し、人間が理解しやすい構造にします。画像内に複数写っている対象物に対して良品・不良品の判定をする必要がある場合、深層学習ベースのモデルであれば、エンドツーエンド学習によって一気通貫で結果まで出力されるように学習しますので、判断プロセスがブラックボックス化してしまいます。そこで、あえてタスクを2つに分割し、最初の処理で一つ一つの対象物を画像から抽出し、次の処理で、それらの対象物の良品・不良品を判断するようにします。こうした多段階での処理を行えば、処理の解釈性が向上し、判断理由を探りやすくなります。
  • タスクによっては、従来手法のほうが適している場合もあります。例えば、正確に対象物の位置を求める、サイズを計測することには、既存のルールベース手法のほうが圧倒的に精度は高く、深層学習を適用する理由はほとんどありません。そもそも、深層学習ベースの手法を導入するべきなのかから検討してみてみることも必要です。

導入後の運用の考え方

深層学習や機械学習ベースのAIシステムの運用時は、通常のシステムの運用と異なる点が2つあります。稼働時に完璧を求めず、利用しながら精度の向上を目指すこと、AIモデルは利用しているうちに精度が悪化するため見直し(再学習の繰り返し)が前提になることです。AIシステムは稼働後もモデルの精度を向上・維持させる必要があります。AIシステムの運用フェーズでは、精度をどのように測定するのかといった判断基準を用意しておく必要があります。そして、精度が悪化した場合の対応についても決めておく必要があります。また、モデルの再学習には、運用中に蓄積されたデータを学習データとして利用することになります。それらのデータの質が学習データとして利用する基準を満たしていない可能性もあります。蓄積されたデータから、学習データとして利用可能なデータを取捨選択するための判断基準も必要となります。

AIシステムは、入力データに対して、学習・推論を行います。データが一定以上変化した場合、AIシステムの精度が悪化するなどの影響が発生します。これらの影響を監視し、システムへの悪影響を防ぐことが運用フェーズで求められます。AIシステムに影響を与えるデータの変化は、様々な要因で発生します。例えば、製造ラインで加工方法に変更があり、新しい形状のキズが不良として出てしまった際には、AIに新しいキズの形状を学習させなければ不良を見逃してしまう可能性があります。

FAを例にして、深層学習ベースの画像認識技術を導入するにあたり、考慮が必要な観点をまとめました。FA以外の画像認識の領域でも、同様に事前に検討しておくことをおすすめします。例えば、紙媒体の残る業務で使われることの多いOCR(Optical Character Recognition:光学的文字認識)でも、スキャンする際の原稿の向きを揃える、スキャナーの解像度を上げるといったよう簡単な対応で、大幅に精度向上することもあります。

また上記観点については、画像認識だけではなく、それ以外のAI全般技術を導入する際に検討すべきことかもしれません。

これまで述べたように、深層学習の登場によって、画像認識技術は飛躍的に発展し、幅広い用途に対応できるようになりました。画像認識技術は日進月歩で進化しており、製品やサービスの品質向上や業務効率化、コスト削減などの効果が期待されます。画像認識技術の導入の画像認識技術の導入のための敷居も大幅に下がりました。とは言え、PoC(概念実証)を実施した結果ROI(投資収益率)が見合わなく、PoCだけで終わってしまうケースも多々あります。

これから画像認識技術を導入しようとする場合、AIベースの技術を検討することになると思います。その場合、AIの専門知識は必要不可欠となりますので、外部の専門家に頼ることも検討すべきです。AI専門家とドメイン知識を持った人材の融合でAI推進体制を構築することが重要です。

また画像認識の分野は、FAのように深層学習が登場する前から画像認識技術が利用されている分野も一定数存在します。そういった分野では、AIのみではなく、従来技術の知見を持っているほうが、より適切な技術を導入することができるはずです。

※DXについて詳しく知りたい方はこちらの記事をお読み下さい。
【関連】DX(デジタルトランスフォーメーション)とは?「DX=IT活用」ではない。正しく理解したいDXの意義と推進のポイント


このページをシェアする

株式会社ブレインパッドについて

2004年の創業以来、「データ活用の促進を通じて持続可能な未来をつくる」をミッションに掲げ、データの可能性をまっすぐに信じてきたブレインパッドは、データ活用を核としたDX実践経験により、あらゆる社会課題や業界、企業の課題解決に貢献してきました。 そのため、「DXの核心はデータ活用」にあり、日々蓄積されるデータをうまく活用し、データドリブン経営に舵を切ることであると私達は考えています。

メールマガジン

Mail Magazine