ホーム > Blog

多品種検査でVLMが効く理由|仕組みと適用条件

VLMはどの検査に使うべきで、どの検査に使うべきではないのか。40件以上の導入データから判断基準を解説。

2026-05-05 · Nsight Inc.

VLMとは何か(30秒で理解する)

VLM(Vision Language Model)は、画像とテキストを同時に理解するAIモデルです。「この画像にキズはあるか?」と自然言語で質問すると、画像を分析して回答します。

多品種外観検査では、VLMを「検査そのもの」ではなく「検査を支えるバックエンドツール」として活用します。これが最も重要なポイントです。

Nsight現場データ|40件以上の導入実績から

VLMを検査推論に直接使用した場合のタクトタイム:500ms〜2秒/枚(Jetson AGX Orin)。
ルールベース+従来AI(TensorRT)の場合:20〜80ms/枚。
結論:VLMは推論速度が10〜50倍遅い。リアルタイム検査には不向き。

多品種検査におけるVLMの3つの活用法

活用法1:NG画像の自動生成(最も効果が高い)

多品種検査の最大のボトルネックは「品種ごとの不良サンプルが足りない」ことです。VLMは良品画像から不良品画像を自動生成し、学習データ不足を解消します。

Nsight現場データ|学習データ量の比較

従来方式:品種あたり200〜500枚のNG画像が必要。品種数50で合計10,000〜25,000枚。
VLM活用時:品種あたり実NG画像5〜10枚 + VLM生成100枚。品種数50で実画像250〜500枚。
データ収集コスト:95%削減。

活用法2:オートアノテーション

不良箇所のラベル付け(アノテーション)をVLMが自動で行います。人間は結果をレビューするだけ。

Nsight現場データ|アノテーション工数

手動:1品種あたり4〜8時間。品種数50で200〜400時間(50〜100万円)。
VLMオートアノテーション:1品種あたり30分(レビュー込み)。品種数50で25時間。
工数削減率:90%。精度:人手の85〜95%(残りは人間がレビュー修正)。

活用法3:ラベル文字認識(VLM-OCR)

VLMが画像内の文字を直接読み取り、マスターデータと照合します。従来のOCRと違い、品種ごとのテンプレート設定が不要です。

VLMの活用方法を相談したい方

無料相談する →

VLMを使うべきケース・使うべきでないケース

ケースVLM活用理由
品種数50以上で不良サンプル不足✅ 強く推奨NG画像生成で学習データ問題を解決
ラベル印字検査(多品種)✅ 強く推奨品種ごとのOCR設定不要
品種切替時の品種識別✅ 推奨バーコードなしでも画像から品種判別
タクトタイム100ms以下の高速検査❌ 不向きVLM推論は500ms以上。ルールベース+従来AIを使用
単品種の大量生産❌ 不要品種数1-3なら従来Deep Learningで十分
寸法公差±0.01mm以下❌ 不向き画像検査ではなく3D計測を推奨

VLMの限界と対策

限界1:推論速度

VLMの推論は500ms〜2秒/枚。Nsightではこの問題をハイブリッド構成で解決しています。VLMはオフライン処理(NG画像生成・アノテーション)に限定し、リアルタイム検査はTensorRTで最適化した従来AIモデルが担います。

限界2:ハルシネーション(誤回答)

VLMは「もっともらしい嘘」を生成することがあります。外観検査では誤判定は許容されません。Nsightではルールベース検査を第一優先とし、AI判定にはconfidence score(確信度)の閾値を設けて、不確実な判定は人間にエスカレーションします。

まとめ

VLMは多品種外観検査を変革する強力なツールですが、万能ではありません。NG画像生成・オートアノテーション・ラベル文字認識の3つの用途に絞って活用し、リアルタイム検査はルールベース+従来AIに任せる。この使い分けが多品種検査成功の鍵です。

多品種検査のVLM活用、まずは無料相談

無料相談する →

よくある質問

多品種検査でVLMはどう使う?

VLMはNG画像生成・オートアノテーション・ラベル文字認識の3つの用途で活用します。検査推論には使わず、バックエンドツールとして学習コストを削減するのが正しい使い方です。

VLMの推論速度はどのくらい?

Jetson AGX Orinで500ms〜2秒/枚。タクトタイム100ms以下の検査には不向きです。リアルタイム検査にはTensorRTで最適化した従来AIモデル(20〜80ms/枚)を使います。

VLMで生成したNG画像の品質は?

Nsightの40件以上の導入実績では、VLM生成NG画像で学習したモデルの検出率は、実NG画像のみで学習した場合と比較して95〜98%の水準。実用上十分な品質です。

VLMの導入に追加費用はかかる?

NsightのシステムにはVLM機能が標準搭載されています。追加のライセンス費用はありません。ハードウェアはJetson AGX Orin 64GBが必要です。

監修:元キーエンス画像処理部門エンジニア

Nsight株式会社の技術チームが監修。キーエンス画像処理部門での実務経験をもとに、製造業向けAI外観検査システムの設計・導入を行っている。会社概要 →