不良サンプル不足は構造的な問題 ── 現場の怠慢ではない
製造業においてNG画像が足りないのは、品質管理が優秀な工場ほど深刻な問題です。不良率を下げるために努力してきた結果、不良品の絶対数が減り、AI学習に必要なデータが集まらない。皮肉な構造ですが、これが現実です。
不良率0.01%(PPMレベル)の工場では、100万個生産して不良は100個。そこから不良モード別に分類すると、1パターンあたり数枚〜十数枚しかありません。「NG画像を集めてください」と言われても、集められないのが実情です。
3つのアプローチで解決する
アプローチ1:データを集める(蓄積戦略)
不良品が発生したら確実に画像を残す仕組みを作ります。
- 全NG品の自動撮影:検査ラインにカメラを設置し、NG判定品を自動撮影・保存する仕組みを導入
- 過去データの掘り起こし:紙の品質記録から不良の傾向を分析し、類似画像を収集
- 意図的な不良品作成:試作品やサンプル品でわざと不良を作り撮影する。ただし照明条件は本番と揃えること
蓄積戦略は時間がかかりますが、最も品質の高い学習データが得られます。本番稼働後は自動的にデータが蓄積される仕組みを作っておくことが重要です。
アプローチ2:データを作る(生成戦略)
- データ拡張:既存NG画像を5〜10倍に水増し。即実装可能だが未知パターンには非対応
- VLMによる自動生成:VLMが不良パターンを理解し、良品画像から仮想NG画像を自動生成。0枚からスタート可能
- GANによる大量生成:NG画像が50枚以上蓄積された段階で、高品質なNG画像を大量生成
アプローチ3:データなしで動く仕組みを作る(設計戦略)
- 良品学習(異常検知):良品画像のみで学習し、正常から逸脱したものを異常として検出
- ハイブリッド検査:ルールベース+AI+VLMの3層構成で、各層が得意な検査を分担
- 段階的導入:最初は簡易な検査項目だけをAI化し、データが溜まったら対象を拡大
3つのアプローチの組み合わせ方
| フェーズ | 蓄積戦略 | 生成戦略 | 設計戦略 |
|---|---|---|---|
| 導入初期(〜1ヶ月) | 自動撮影の仕組み構築 | VLMで仮想NG画像生成 | 良品学習+ハイブリッド構成 |
| 運用期(1〜3ヶ月) | 実NG画像の蓄積開始 | 合成比率を段階的に削減 | AI対象の検査項目を拡大 |
| 安定期(3ヶ月〜) | 実データが主体に移行 | GANで稀な不良モードを補完 | 全検査項目をAI化 |
Nsightの推奨戦略
上記3つのアプローチを段階的に組み合わせます。導入初期は「アプローチ3(設計戦略)+アプローチ2(VLMによる生成)」でスタートし、本番稼働後に「アプローチ1(蓄積)」で実データを増やしていきます。重要なのは「データが揃うまで待つ」のではなく「今あるデータで始める」こと。待っている間にも検査員は高齢化し、人手不足は進みます。
まとめ
不良サンプル不足はAI外観検査の最大の壁ですが、蓄積・生成・設計の3つの戦略を組み合わせることで解決できます。完璧なデータが揃うのを待つ必要はありません。VLMによるNG画像自動生成とハイブリッド検査構成で「今日から始められる」のが、現在のAI外観検査の到達点です。
関連記事
NG画像生成で外観検査を変える