文字認識(OCR)の基本原理
OCRは「文字の切り出し」と「辞書データとの照合」の2段階で処理されます。まず検査領域内から1文字ずつ画像を切り出し、次にその画像を辞書に登録されている各文字と比較して最も一致度(認識度)の高い文字を選びます。
文字切り出しの方式
認識切り出し
辞書情報を参照しながら最適な範囲で文字を切り出す方式。オートチューニングで自動設定が可能。
投影切り出し
画像の濃淡情報の投影波形を使って文字を切り出す方式。波形を見ながら手動調整が可能。
固定切り出し
文字の位置が固定の場合に、あらかじめ設定した位置で切り出す方式。
文字検査の種類
| 検査種別 | 内容 | 用途例 |
|---|---|---|
| 印字有無 | 印字の存在を検出 | ラベル貼り忘れの検出 |
| 印字品質 | 読み取れない文字を検出 | かすれ・にじみの検出 |
| 文字照合(OCV) | 印字と判定文字列を比較 | 賞味期限・ロット番号の照合 |
| 文字認識(OCR) | 印字された文字を読み取り出力 | トレーサビリティ記録 |
1D/2Dコード検査
バーコード(1D)やQRコード・DataMatrix(2D)の読み取りも画像処理の重要な用途です。読み取ったコード情報と登録データを照合し、品種判別や出荷管理に活用します。印字品質の検証機能により、印字状態の経時変化も監視できます。
VLMによるラベル文字認識の進化
従来のOCRは事前に辞書を登録する必要があり、多品種対応やフォント変更への対応に手間がかかりました。VLM(Vision Language Model)は学習なしで文字の位置と意味を理解し、マスターデータと照合できます。
Nsightではラベル文字認識・照合についてVLMが検査自体を行います。品種が変わっても設定変更なしで対応可能で、多言語にも対応しています。
Nsightのアプローチ
Nsightは元キーエンス画像処理部門のメンバーが在籍しており、従来OCRとVLMの最適な使い分けを提案します。高速インライン検査には従来OCR、多品種・多言語・レイアウト変更が頻繁な場合はVLMが有利。検査要件に応じて最適な方式を設計します。
多品種外観検査(VLMは裏方として活用)
ルールベース+従来AIで検査を行い、VLMは「学習コストを下げる武器」として裏方で活用します。NG画像生成・アノテーション自動化・ブラウザベースの学習機能の3つをパッケージ化していく方針です。これらの機能により、お客様にとっての使いやすさを高めると同時に、各現場の検査データを蓄積できる構造を作ります。
ラベル文字認識・照合(VLMが検査自体を行う)
賞味期限・ロット番号・産地情報等の日本語テキストを読み取り、マスターデータと照合する用途です。VLMが学習なしで文字の位置と意味を理解するため、品種が変わっても設定変更なしで対応可能です。
サンプル画像をお送りいただければ、検査精度の無料検証を実施します。
無料サンプル検証を依頼する →OCR・バーコード検査の業務上の役割
OCR(光学文字認識)とバーコード読取は、製造業で「品種識別・トレーサビリティ・賞味期限管理」を担う基幹技術。AI技術と統合することで認識精度・対応範囲が大幅に拡大しました。
OCR技術の進化
第1世代:パターンマッチング
事前登録の文字パターンと比較。フォント・サイズが固定の用途のみ対応。
第2世代:機械学習OCR
SVM・CNNによる文字認識。多様なフォントに対応開始。
第3世代:VLMベースOCR
大規模言語モデルベースで、装飾フォント・多言語・かすれ文字も認識可能。
バーコード規格と読取要件
| 規格 | 用途 | 特徴 |
|---|---|---|
| JAN/EAN | 商品コード | 日本標準 |
| CODE128 | 物流・産業 | 高密度 |
| QRコード | 多用途 | 2D・大容量 |
| DataMatrix | 小型部品 | 2D・極小 |
| PDF417 | ID・チケット | 2D・スタック |
OCR・バーコード検査の典型シーン
- 賞味期限・ロット番号印字検証
- 商品ラベル品種判別
- 部品トレーサビリティ
- 物流ピッキング照合
- 医薬品の規制対応表示
難しい撮像条件への対応
条件①: 装飾フォント・特殊書体
VLMベースOCRが従来手法を大きく上回る精度。
条件②: 印字かすれ・部分欠損
欠損補完アルゴリズム+文脈推定で読取精度を維持。
条件③: 曲面・透明・反射面
多角度撮像+画像補正で対応。
条件④: 高速ライン
エッジAI推論で高速処理を実現。
VLMベースOCRの優位性
VLMベースOCRが従来手法を大きく上回る点は、装飾フォント・多言語・かすれ文字への対応力です。化粧品ラベルの装飾的な手書き風フォント、英中日韓の混在、印字かすれ、部分欠損など、従来OCRでは対応困難だった条件でも、人間と同等以上の認識精度を実現。これにより、OCR検査の適用範囲が劇的に拡大しました。
バーコード規格の選定基準
製品にどのバーコード規格を採用するかは、業務要件に応じた選定が必要です。一般消費財はJAN/EAN(13桁)、物流・産業用はCODE128(高密度)、多容量データはQRコード(2D・最大数千文字)、極小部品はDataMatrix(2D・小型)、ID・チケットはPDF417(2D・スタック)。用途に応じた規格選定が、運用安定性に直結します。
OCR・バーコード検査の典型エラーパターン
OCR・バーコード検査の典型的エラーパターンを把握することで、運用安定性を向上できます。主要パターンは、印字かすれ・印字欠け、撮像時の歪み・ぶれ、照明変動による視認性低下、被写体の汚れ・損傷、表面反射による読取困難。これらのパターンに対し、撮像条件改善・前処理アルゴリズム強化・複数フレーム合成などの対策が標準的です。
OCR・バーコード検査の運用ベストプラクティス
OCR・バーコード検査の運用は、撮像条件の安定化、定期的な精度モニタリング、新規格・新フォントへの対応、エラーパターンの蓄積分析が運用品質を決定します。月次の運用レビューが標準的です。