文字認識(OCR)の基本原理
OCRは「文字の切り出し」と「辞書データとの照合」の2段階で処理されます。まず検査領域内から1文字ずつ画像を切り出し、次にその画像を辞書に登録されている各文字と比較して最も一致度(認識度)の高い文字を選びます。
文字切り出しの方式
認識切り出し
辞書情報を参照しながら最適な範囲で文字を切り出す方式。オートチューニングで自動設定が可能。
投影切り出し
画像の濃淡情報の投影波形を使って文字を切り出す方式。波形を見ながら手動調整が可能。
固定切り出し
文字の位置が固定の場合に、あらかじめ設定した位置で切り出す方式。
文字検査の種類
| 検査種別 | 内容 | 用途例 |
|---|---|---|
| 印字有無 | 印字の存在を検出 | ラベル貼り忘れの検出 |
| 印字品質 | 読み取れない文字を検出 | かすれ・にじみの検出 |
| 文字照合(OCV) | 印字と判定文字列を比較 | 賞味期限・ロット番号の照合 |
| 文字認識(OCR) | 印字された文字を読み取り出力 | トレーサビリティ記録 |
1D/2Dコード検査
バーコード(1D)やQRコード・DataMatrix(2D)の読み取りも画像処理の重要な用途です。読み取ったコード情報と登録データを照合し、品種判別や出荷管理に活用します。印字品質の検証機能により、印字状態の経時変化も監視できます。
VLMによるラベル文字認識の進化
従来のOCRは事前に辞書を登録する必要があり、多品種対応やフォント変更への対応に手間がかかりました。VLM(Vision Language Model)は学習なしで文字の位置と意味を理解し、マスターデータと照合できます。
Nsightではラベル文字認識・照合についてVLMが検査自体を行います。品種が変わっても設定変更なしで対応可能で、多言語にも対応しています。
Nsightのアプローチ
Nsightは元キーエンス画像処理部門のメンバーが在籍しており、従来OCRとVLMの最適な使い分けを提案します。高速インライン検査には従来OCR、多品種・多言語・レイアウト変更が頻繁な場合はVLMが有利。検査要件に応じて最適な方式を設計します。
多品種外観検査(VLMは裏方として活用)
ルールベース+従来AIで検査を行い、VLMは「学習コストを下げる武器」として裏方で活用します。NG画像生成・アノテーション自動化・ブラウザベースの学習機能の3つをパッケージ化していく方針です。これらの機能により、お客様にとっての使いやすさを高めると同時に、各現場の検査データを蓄積できる構造を作ります。
ラベル文字認識・照合(VLMが検査自体を行う)
賞味期限・ロット番号・産地情報等の日本語テキストを読み取り、マスターデータと照合する用途です。VLMが学習なしで文字の位置と意味を理解するため、品種が変わっても設定変更なしで対応可能です。
サンプル画像をお送りいただければ、検査精度の無料検証を実施します。
無料サンプル検証を依頼する →