「NG画像が足りないからAI検査は無理」は過去の常識
「NG画像が10枚しかないからAI検査は導入できない」──これは2023年頃までの常識でした。従来のディープラーニング(CNN)は1クラスあたり100〜500枚の教師データが必要で、NG画像が少なければ精度が出ないのは事実でした。
しかし現在は、NG画像が極端に少ない状況でもAI検査を導入する方法が複数存在します。ポイントは「NG画像を集める」ことだけに固執せず、「NG画像がなくても動く仕組みを組み合わせる」ことです。
対策1:良品学習(異常検知モデル)── NG画像0枚で開始
良品画像だけで学習し、良品と異なるものを「異常」として検出する手法です。PatchCoreやAutoEncoderが代表的なアルゴリズムで、NG画像が0枚でも学習を開始できます。
ある精密部品メーカーで良品学習モデルを導入した際、良品画像200枚のみで学習したモデルが検出率87%を達成しました。ただし過検出率が22%と高く、良品の5分の1以上がNGと誤判定されました。良品学習は「見逃しを防ぐ」には強いですが、「過検出を抑える」には弱い。対策2〜5と組み合わせて精度を上げていきます。
対策2:データ拡張 ── 既存NG画像を最大限活用
少数のNG画像を回転・反転・色調変更で5〜10倍に増やす手法。最もコストが低く、即実装可能です。10枚を100枚に増やせますが、元画像にない不良パターンは生成できません。「既知の不良の汎化」に限定される点を理解して使います。
対策3:VLMによるNG画像自動生成 ── 0枚から仮想NG画像を作る
VLMが不良パターンを理解し、良品画像から仮想NG画像を自動生成する手法です。NG画像が0枚でも生成を開始でき、アノテーションまで自動化されます。
ある化粧品メーカーのラベル検査では、実物NG画像8枚の状態からVLMで各パターン60枚、合計300枚の仮想NG画像を生成。これを学習に使い、初期モデルで検出率92%を達成しました。
対策4:転移学習 ── 他の知識を流用する
ImageNetなど大規模データで事前学習したモデルを、自社のデータでファインチューニングする手法です。「画像の特徴を抽出する能力」は事前学習で獲得済みなので、少量のデータでも高い精度を出せます。
実務上のポイントは、事前学習データと自社データの「ドメインギャップ」です。自然画像(犬や猫の写真)で学習したモデルを金属部品の検査に転移する場合、浅い層(エッジやテクスチャ)の知識は流用できますが、深い層(物体の概念)の知識は役に立ちません。製造業向けの事前学習モデルがあればベストですが、現状ではImageNet事前学習+ファインチューニングが最も一般的です。
対策5:ハイブリッド検査 ── AIだけに頼らない
全ての検査をAIに任せるのではなく、ルールベース検査(閾値判定)とAIを組み合わせるハイブリッド構成です。「明らかなNG」はルールベースで高速に弾き、「微妙な判定」だけをAIに回す。これにより、AIが必要とするNG画像の数を大幅に減らせます。
Nsightの検査システムはこのハイブリッド構成を基本としています。ルールベース+従来AI+VLMの3層構成で、各層が得意な検査を分担します。
5つの対策の組み合わせ方
Nsightでは対策3(VLMによるNG画像自動生成)と対策5(ハイブリッド検査)を軸に、対策1(良品学習)で初期スクリーニング、対策2(データ拡張)で既存データの活用、対策4(転移学習)でCNNの効率的な学習を組み合わせています。5つを単独で使うのではなく、組み合わせることで相乗効果が生まれます。
まとめ
NG画像が少ないことはAI外観検査の障壁ですが、克服不可能な壁ではありません。良品学習で0枚から始め、VLMで仮想NG画像を生成し、ハイブリッド構成でAIの負担を減らす。この組み合わせにより、NG画像が10枚以下でも実用的な検査精度を実現できます。