NG画像が10枚以下でもAI外観検査を導入する5つの実践的な対策を解説。良品学習・VLM・ハイブリッド検査の組み合わせ方。
「NG画像が10枚しかないからAI検査は導入できない」──これは2023年頃までの常識でした。従来のディープラーニング(CNN)は1クラスあたり100〜500枚の教師データが必要で、NG画像が少なければ精度が出ないのは事実でした。
しかし現在は、NG画像が極端に少ない状況でもAI検査を導入する方法が複数存在します。ポイントは「NG画像を集める」ことだけに固執せず、「NG画像がなくても動く仕組みを組み合わせる」ことです。
不良率が低い高品質生産現場ほど、NG画像(不良サンプル)が集まらない。AI検査導入の最大の障壁となるこの問題への解決策を体系化します。
良品画像だけで学習し、良品と異なるものを「異常」として検出する手法です。PatchCoreやAutoEncoderが代表的なアルゴリズムで、NG画像が0枚でも学習を開始できます。
ある精密部品メーカーで良品学習モデルを導入した際、良品画像200枚のみで学習したモデルが検出率87%を達成しました。ただし過検出率が22%と高く、良品の5分の1以上がNGと誤判定されました。良品学習は「見逃しを防ぐ」には強いですが、「過検出を抑える」には弱い。対策2〜5と組み合わせて精度を上げていきます。
手持ちのNG画像が少量でも、データ拡張によって学習データを増やすことができます。回転・反転・輝度変化・ノイズ付加などの幾何学変換や色調変換を組み合わせ、1枚のNG画像から数十枚の学習データを生成します。
ただし、意味のない変換は逆効果になることがあります。例えばキズの方向が重要な検査では無制限の回転拡張は避け、実際にあり得る姿勢変動の範囲内で拡張することが重要です。
VLMが不良パターンを理解し、良品画像から仮想NG画像を自動生成する手法です。NG画像が0枚でも生成を開始でき、アノテーションまで自動化されます。
ある化粧品メーカーのラベル検査では、実物NG画像8枚の状態からVLMで各パターン60枚、合計300枚の仮想NG画像を生成。これを学習に使い、初期モデルで検出率92%を達成しました。
VLMによるNG画像生成を試してみませんか?
無料相談する →ImageNetなど大規模データで事前学習したモデルを、自社のデータでファインチューニングする手法です。「画像の特徴を抽出する能力」は事前学習で獲得済みなので、少量のデータでも高い精度を出せます。
実務上のポイントは、事前学習データと自社データの「ドメインギャップ」です。自然画像(犬や猫の写真)で学習したモデルを金属部品の検査に転移する場合、浅い層(エッジやテクスチャ)の知識は流用できますが、深い層(物体の概念)の知識は役に立ちません。製造業向けの事前学習モデルがあればベストですが、現状ではImageNet事前学習+ファインチューニングが最も一般的です。
また、類似品種・類似業界のNGデータを転移することも有効です。少量データで実用精度を確保できます。
全ての検査をAIに任せるのではなく、ルールベース検査(閾値判定)とAIを組み合わせるハイブリッド構成です。「明らかなNG」はルールベースで高速に弾き、「微妙な判定」だけをAIに回す。これにより、AIが必要とするNG画像の数を大幅に減らせます。
Nsightの検査システムはこのハイブリッド構成を基本としています。ルールベース+従来AI+VLMの3層構成で、各層が得意な検査を分担します。
VLM合成生成
OK画像をベースに、VLMで人工的にNG画像を生成。少量実NGから数百枚に拡張可能。
異常検知(One-Class学習)
OK画像のみでモデル学習し、分布外を異常とする手法。NG画像なしでも実装可能。
転移学習
類似品種・類似業界のNGデータを転移。少量データで実用精度。
人工不良サンプル作成
OK品にあえて傷をつけて不良サンプル化。確実だが工数大。
段階的データ蓄積
運用開始後の実NGを継続蓄積し、定期的にモデル更新。
まとめ:NG画像が少ないことはAI外観検査の障壁ですが、克服不可能な壁ではありません。良品学習で0枚から始め、VLMで仮想NG画像を生成し、ハイブリッド構成でAIの負担を減らす。この組み合わせにより、NG画像が10枚以下でも実用的な検査精度を実現できます。
| 業界 | 主要手法 | 典型データ量 |
|---|---|---|
| 食品 | VLM合成+転移 | OK500、NG生成200 |
| 自動車 | 異常検知+VLM | OK1000、NG少量 |
| 化粧品 | VLM+人工サンプル | OK300、NG生成150 |
| 樹脂 | 転移+段階蓄積 | OK500、NG30 |
※ 掲載の金額・単価は執筆時点の参考値です。実際の費用は要件・時期により変動します。
少量NGデータでの検査構成を相談したい
無料相談する →現時点では、VLMは裏方(NG画像生成・オートアノテーション・学習データ拡張)として活用し、本番判定は軽量モデルが主流です。
実NGサンプル数枚から数百枚規模の学習データを生成でき、少量サンプル問題の解決に寄与します。
人間アノテーターの補助レベルで80〜95%の精度が出ます。最終チェックは人間が行う運用が推奨です。