多品種AI外観検査 VLM活用ガイド

「うちは品種が多すぎてAIは無理」を
覆した3つの現場の話

化粧品・鉄鋼・食品の3工場が多品種でもAI検査を成功させた具体的な経緯とVLMの活用法。「多品種だからAIは無理」が間違いである理由。

2026-04-24 / 最終更新 2026-04-24 / Nsight Inc.
01
「多品種だからAIは無理」はVLMハイブリッド構成の登場で過去の話になりつつある。化粧品・鉄鋼・食品の3現場が実証。
02
VLMは少数ショット学習・自然言語指示・NG画像合成の3つの革新性で、品種ごとの大量学習データという従来の前提を崩した。
03
本番ループはCNN×ルールベースが担当し、VLMはバックエンドの学習データ生成・アノテーション自動化・グレーゾーン補助に専念する構成が標準。
― 目次
  1. 現場①:化粧品メーカー(50品種以上)
  2. 現場②:鉄鋼メーカー(多品種の電極製品)
  3. 現場③:食品メーカー(形状ばらつきのある食品)
  4. 共通する3つの成功要因
  5. VLMが多品種検査をどう変えたか
  6. VLMの3つの革新性
  7. VLM活用の実装アーキテクチャ
  8. 多品種検査でのVLM運用パターン
  9. VLM活用での注意点
  10. VLMの本番運用アーキテクチャ
  11. VLM対応の検査運用変革
  12. VLM技術の今後の進化方向
  13. 関連記事
  14. よくある質問

「品種が多すぎるから、AIの外観検査はうちには合わない」——これは製造業でAI導入を検討する際に、最も頻繁に聞く断り文句です。

確かに従来のDeep Learning検査では品種ごとにAIモデルを開発する必要があり、多品種ラインでは非現実的でした。しかしVLMハイブリッド構成の登場で、この前提が変わりつつあります。

― 01 / 現場①

現場①:化粧品メーカー(50品種以上)

50品種以上のラベル印字検証が必要だったが、大手SIの見積もりが約3,000万円で断念。VLMベースのシステムを導入し、学習データゼロで稼働開始。VLMが学習なしで文字の位置と意味を理解し、マスターデータと照合。

成功の鍵

「品種ごとの個別開発」をやめ、VLMによるNG画像生成とオートアノテーションで学習コストを大幅削減。

― 02 / 現場②

現場②:鉄鋼メーカー(多品種の電極製品)

電極製品の形状・サイズ・刻印が品種ごとに異なり、検査設定の切替に時間がかかっていた。VLM+AI-OCRのハイブリッドで品種切替なしの一括検査を実現。

成功の鍵

表面欠陥はルールベース+VLM、刻印読み取りはVLM+AI-OCRという役割分担の設計。

― 03 / 現場③

現場③:食品メーカー(形状ばらつきのある食品)

形状がバラバラの食品を正確にカウントする必要があったが、重量式では精度不安定。VLMで画像認識ベースの99%+カウント精度を実現。

成功の鍵

「定形品向けのアルゴリズム」ではなく、VLMの「画像全体の文脈理解」を活用。

― 04 / 共通要因

共通する3つの成功要因

1

最初から多品種前提で設計

1品種での成功→横展開ではなく、多品種対応を前提としたシステム設計。

2

ハイブリッド構成

VLM単体ではなく、ルールベース×従来AI×VLMの適材適所の組み合わせ。

3

照明・カメラの専門設計

AIモデルだけでなく、撮像環境(照明・カメラ・治具)の最適化を同時に実施。

― 05 / VLMの変革

VLMが多品種検査をどう変えたか

従来のディープラーニング検査は、品種ごとに数百〜数千枚の学習データが必要で、新品種追加に数日〜数週間を要しました。VLM(Vision-Language Model)の登場で、この前提が根本的に変わりました。

VLM IMPACT VLMが多品種検査を変えた3つの仕組み 少数ショット学習・10〜30枚で対応・従来1/100・新品種即対応 自然言語指示・テキストで基準・プログラム不要・現場運用可 NG画像生成・希少不良補完・データ拡張・バランス確保
― 06 / VLMの革新性

VLMの3つの革新性

革新①: 少数ショット学習

VLMは事前学習で多種多様な物体・概念を学習しているため、新品種に対しても10〜30枚程度のサンプルで実用精度に到達。従来手法の1/10〜1/100のデータ量で対応できます。

革新②: 自然言語指示

「ロゴが中央に印刷されているか」「色が指定値±5%以内か」など、自然言語で検査基準を記述可能。プログラミング不要で現場運用者が直接基準を設定できる。

革新③: NG画像合成

OK画像をベースに、VLMで「キズあり」「色ムラあり」のNG画像を合成生成。希少不良の学習データ問題を解決します。

多品種AI検査の導入可能性を、サンプル画像で無料検証

無料サンプル検証を依頼する →
― 07 / 実装アーキテクチャ

VLM活用の実装アーキテクチャ

レイヤー役割使用モデル例
VLMバックエンドNG生成・オートアノテーションGPT-4V、Claude等
軽量推論モデル本番判定(高速)カスタムCNN、YOLO
ハイブリッド層難ケースをVLMにフォールバック動的振り分け
― 08 / VLM運用パターン

多品種検査でのVLM運用パターン

パターン①: 品種マスターテキスト

「ロゴA、色C5、サイズS、装飾パターンX」など品種ごとの特徴をテキスト記述。VLMがこのテキストを参照して判定基準を動的構築。

パターン②: 多品種共通汎化モデル

業界別(化粧品・自動車・樹脂等)の汎化モデルを構築。新品種追加時はマスターテキスト更新のみで対応可能。

パターン③: アクティブラーニング

判定スコアが閾値付近の曖昧サンプルだけを人間レビューに回し、効率的にモデル改善。

― 09 / 注意点

VLM活用での注意点

注意点①: 推論速度のトレードオフ

VLM自体は推論が重く、高速ラインの本番判定には不向き。VLMはバックエンドの学習・データ拡張・難ケース処理に使い、本番判定は軽量モデルで行うハイブリッド構成が標準。

注意点②: マスターテキストの精度

VLM判定の精度は、マスターテキストの記述品質で決まります。判定基準を曖昧に書くと、VLMも曖昧判定するため、テンプレート化と運用ルールが重要。

注意点③: コスト管理

クラウドVLMはAPI課金型のため、大量画像処理ではコスト管理が必須。エッジでのVLM活用は徐々に進んでいるが2026年時点では限定的。

※ 掲載の金額・単価は執筆時点の参考値です。実際の費用は要件・時期により変動します。

― 10 / 本番運用アーキテクチャ

VLMの本番運用アーキテクチャ

VLMの本番運用は、軽量モデルとのハイブリッド構成が標準です。本番判定の90%は軽量CNNでJetson推論し、難ケース10%だけクラウドVLMにフォールバック。VLMはバックエンドでオートアノテーション・NG画像生成・モデル改善に使用。この階層構成により、推論コストとレイテンシを抑えつつ、VLMの利点を最大限活用できます。

VLMハイブリッド構成について詳しく相談する

無料相談する →
― 11 / 検査運用変革

VLM対応の検査運用変革

VLM対応により、従来の検査運用フローが大きく変革します。

項目従来手法VLM対応後
新品種立ち上げ時間1〜2週間数時間
必要学習データ500枚以上10〜30枚
品種切替工数30〜60分5〜10分
説明可能性

これらが組み合わさることで、多品種ラインの検査運用が経営効率の高い形に進化します。

― 12 / 今後の進化

VLM技術の今後の進化方向

VLM技術は2026年現在も急速に進化中です。今後の進化方向は以下の通りです。

これらの進化により、AI検査の適用範囲がさらに拡大すると見込まれます。継続的な技術ウォッチが投資判断の精度を上げます。

― 13 / 関連

関連記事

同カテゴリ:多品種・VLM活用

選定・比較・PoC

物流現場でも、同じ技術が使えます

製造ラインで培ったVLM・エッジAI・光学設計のノウハウは、物流の入荷検品・OCR・倉庫オペにも応用できます。

― 14 / FAQ

よくある質問

品種が50以上あってもAI検査は可能?

はい。VLMによるNG画像生成で学習データの不足を補完し、オートアノテーションで教師データ作成を自動化することで、多品種でも対応可能です。

VLMは検査自体を行う?

多品種外観検査ではVLMは裏方として活用します。検査はルールベース+従来AIが行います。ただし、ラベル文字認識・照合ではVLMが検査自体を行います。

VLMによるオートアノテーションの精度は?

人間アノテーターの補助レベルで80〜95%の精度が出ます。最終チェックは人間が行う運用が推奨です。

VLMでできないタスクは何ですか?

高速リアルタイム判定、極めて高精度な寸法測定、極小欠陥の検出などは従来手法が優位です。

VLM学習に必要なデータ量は?

ゼロショット利用なら追加学習不要です。ファインチューニングする場合、数百〜数千枚のラベル付きデータで効果が出ます。

― REVIEWED BY
嶋野(元キーエンス画像処理部門 開発)
キーエンス画像処理部門での実務経験をもとに、製造業の外観検査・画像処理に関する技術監修を行っている。会社概要 →

まずはサンプル画像で無料検証しませんか?

検査対象のサンプル画像をお送りください。最適な検査方式の提案と想定精度を無料で評価します。

無料サンプル検証を依頼する →