物流コンベア上の高速搬送ラベルをラインカメラで正確に読み取るための撮像設計を解説。エリアカメラとの比較、レンズ・照明選定、エンコーダ同期、液体レンズとの組み合わせ、VLM OCRからWMS連携までを元キーエンス画像処理エンジニアが詳述。
物流倉庫の自動仕分けラインやピッキングステーションでは、ケースや荷物の表面に貼付されたラベルの情報を光学的に読み取るニーズが年々高まっています。バーコードリーダーだけでは対応しきれない送り状の文字情報や、複数フォーマットが混在する荷主ラベルの自動読取りには、カメラによるOCRシステムが不可欠です。
しかし、物流コンベア環境は工場の外観検査ラインとは異なる固有の難しさを複数抱えています。
【速度の壁】物流ラインの搬送速度は毎秒1.5m〜3.0mに達することが珍しくありません。この速度でラベルのシャープな画像を取得するには、十分な光量の下で短い露光時間を確保しなければなりません。エリアカメラの場合、グローバルシャッターで数十マイクロ秒の露光に抑える必要がありますが、その短い時間内に十分なコントラストを得るためには照明出力を大幅に引き上げるか、高感度センサを使う必要があります。
【振動の壁】コンベアベルトの走行振動、ケース同士の接触、ラインの合流・分岐ポイントでの衝撃など、物流環境には常に振動源があります。カメラ取付けブラケットに振動が伝わると、画像に微細なブレが乗り、特に小さな文字の読取り精度が大幅に低下します。防振マウントの導入と合わせて、振動の影響を受けにくい撮像方式を選ぶことが重要です。
【高さ変動の壁】物流現場では、10cmのメール便サイズから60cm超の大型段ボールまで、異なるサイズのケースが同一コンベアを流れます。カメラからラベル面までの距離(ワーキングディスタンス)がケースごとに大きく変化するため、固定焦点のレンズではピントが合う範囲を超えてしまいます。この課題については、段ボール高さ違いOCRの液体レンズ活用記事でも詳しく解説しています。
【照明ムラの壁】物流倉庫の天井照明は蛍光灯やLEDベースライトが多く、コンベア上のケースに均一な光を提供する設計にはなっていません。また、ケースの位置によって天井照明からの距離や角度が変わるため、ラベル面の明るさにムラが生じます。光沢のあるラベルやフィルム包装されたケースでは、環境光の映り込みがOCR精度を下げる原因にもなります。
これらの課題を単独で解決しようとすると、過剰なスペックのカメラや複数カメラ構成に走りがちですが、それではコストが膨らみ導入のハードルが上がります。本記事では、ラインカメラを軸にした撮像設計によって、これらの課題を合理的にクリアする方法を順に解説していきます。
物流ラインのラベル読取りシステムを構築する際、最初の分岐点は「エリアカメラで撮るか、ラインカメラで撮るか」です。両者の特性は大きく異なり、搬送ラインの条件に応じた選択が必要です。カメラ選定ガイドでも基礎的な比較を行っていますが、ここでは物流OCR用途に特化して整理します。
| 比較項目 | エリアカメラ | ラインカメラ |
|---|---|---|
| 解像度(幅方向) | 500万〜2000万画素で面全体を一括取得。幅方向の実効分解能はセンサ画素数に依存 | 2k〜16kピクセルの1ラインセンサを搬送方向に連続走査。幅方向の分解能はセンサ画素数、搬送方向はライン周波数で決まる |
| 搬送速度への対応 | グローバルシャッター必須。速度が上がるほど露光時間短縮が必要で、光量要件が急増 | 搬送動作自体をスキャンに利用するため、速度増加に対してはライン周波数を上げるだけで対応可能 |
| 被写界深度 | 面全体を同一焦点で撮るため、高さ変動に弱い。絞り込むと光量不足 | 1ラインにピントを合わせるだけなので、同条件で被写界深度を深く取りやすい |
| 画像サイズ制御 | ケースの長さに関わらずフレーム全体を取得。大型ケースでは解像度不足になる可能性 | トリガー区間を変えるだけでケース長に応じた画像を生成。長尺ケースでも解像度を維持 |
| 照明との相性 | 面照明(バックライト・リング・ドーム等)が標準。搬送中のケースに均一照射が難しい | ライン照明で1ライン分だけ強力に照射すればよく、照明効率が高い |
| システムコスト | カメラ単価は低め。ただし広範囲を高解像度でカバーするには複数台が必要になる場合あり | カメラ単価はやや高め。ただし1台で広幅・高解像度をカバーでき、トータルコストで有利になるケースが多い |
| 導入の複雑さ | フレームトリガーのみで動作し、セットアップが比較的容易 | エンコーダ同期・ライン周波数設定が必要で、初期設定の知見が求められる |
上表のとおり、物流コンベアのOCR用途では、搬送速度対応・被写界深度・照明効率の3点でラインカメラが構造的に有利です。特に搬送速度が1.5m/sを超えるラインや、ケース高さの変動幅が30cmを超える現場では、ラインカメラを第一選択とすべきです。一方、搬送速度が低く(0.5m/s以下)、ケースサイズが均一な小規模ラインでは、エリアカメラのほうがセットアップコスト面で有利になる場合もあります。
ラインカメラは、1列に並んだ画素(リニアセンサ)で1ラインずつ画像を取得し、搬送方向の移動と組み合わせて2次元画像を構成するカメラです。新聞印刷の品質検査やフィルム検査など、連続搬送物の高解像度撮像に長く使われてきた方式であり、物流ラインにもその特性が直接活かせます。
エリアカメラが「1回のシャッターで面全体を撮る」のに対し、ラインカメラは「1回のスキャンで幅方向の1ラインだけを撮る」動作を高速に繰り返します。搬送されるケースが1ラインの撮像位置を通過していく間に、数千〜数万ラインを積み重ねることで、1枚の2次元画像が完成します。
この方式の最大の利点は、搬送方向の解像度がライン周波数(1秒間に何ライン撮像するか)で決まり、ケースの長さに制約されないことです。60cmのケースでも120cmのケースでも、同じ分解能で全面を撮像できます。
ラインカメラの画質を決定的に左右するのが「エンコーダ同期」です。エンコーダはコンベアの搬送距離をパルス信号に変換するセンサで、このパルスに同期してラインカメラの撮像タイミングを制御します。
エンコーダを使わずにタイマー(内部クロック)でラインを撮像する方式もありますが、その場合はコンベアの速度変動が画像の搬送方向の歪みに直結します。物流コンベアはインバータ制御で速度を変えることが多く、荷物の重量によっても実速度が微妙に変化するため、エンコーダ同期は物流用途では必須と考えてください。
搬送方向の分解能は、以下の計算で決まります。
搬送方向の分解能(mm/pixel) = 搬送速度(mm/s) / ライン周波数(Hz)
例えば搬送速度2.0m/s(= 2000mm/s)で、0.1mm/pixelの分解能を確保したい場合、必要なライン周波数は 2000 / 0.1 = 20,000Hz(20kHz)です。これは産業用ラインカメラでは標準的な動作範囲であり、特殊なカメラは不要です。
ただし、ライン周波数が上がるほど1ラインあたりの露光時間は短くなります(20kHzなら最大50マイクロ秒)。この短い露光時間内で十分な光量を確保するには、照明設計が極めて重要になります。この点は後述のセクション5で詳しく解説します。
ラインカメラの性能を引き出せるかどうかは、レンズ選定に大きく依存します。レンズ選定ガイドで解説している基本原則に加え、物流ラインカメラ用途での具体的な設計手順を示します。
物流ラベルのOCR読取りに必要な分解能は、読み取りたい文字の最小サイズから逆算します。一般的な送り状の最小文字(住所欄など)は高さ2mm〜3mm程度です。OCRエンジンが安定して認識するためには、1文字あたり最低20ピクセル程度のサンプリングが必要です。
必要分解能 = 最小文字高さ / 必要ピクセル数 = 2mm / 20px = 0.1mm/pixel
つまり、0.1mm/pixel以下の分解能が物流ラベルOCRの目安となります。より小さな文字(JANコード下の数字など)を読む場合は0.05mm/pixel程度まで要求される場合もあります。
ラインカメラのセンサ画素数が4096ピクセル(4kセンサ)で、分解能0.1mm/pixelを確保する場合、撮像幅は 4096 x 0.1mm = 409.6mm となります。コンベア幅が600mmのラインでは、センサ画素数を8192ピクセル(8kセンサ)に上げるか、ワーキングディスタンスを延ばして画角を広げる必要があります。ただし、ワーキングディスタンスを延ばすと被写界深度が浅くなるため、高さ変動への対応力が低下します。
物流ラインでは前述のとおりケース高さの変動があるため、ある程度の被写界深度が必要です。被写界深度を深くするにはF値(絞り)を大きくしますが、F値を上げると入射光量が減少し、高速撮像時の露光量が不足します。
実務上の目安として、物流ラインカメラではF8〜F11が標準的な設定範囲です。F11以上に絞ると回折の影響でセンサの解像限界を下回るケースもあるため、むやみに絞るのは逆効果です。被写界深度が不足する場合は、液体レンズによる動的ピント調整(セクション6で後述)で補完する設計が有効です。
ラインカメラの撮像設計において、照明は最も工数をかけるべきポイントです。照明設計の基礎で述べたように、「撮れない原因の8割は照明にある」という格言は、物流ラインカメラにも当てはまります。
ラインカメラは1ラインずつ撮像するため、照明も「1ライン分だけ集中的に照射する」ライン照明が最も効率的です。代表的な選択肢は2つあります。
照明の入射角は、ラベル表面の反射特性に応じて決定します。基本パターンは以下のとおりです。
物流現場でよく問題になるのが、光沢のある送り状やフィルム包装上の印字です。これらは鏡面に近い反射特性を持つため、通常の照明配置では白飛びや影ムラが発生しやすくなります。対策として有効なのは以下の3点です。
どの方法が最適かは現場のラベル種類と搬送条件によって変わるため、現場サンプルでの事前検証が不可欠です。
セクション4で述べたとおり、レンズの絞りだけで高さ変動をカバーするには限界があります。液体レンズによる段ボール高さ違いOCRの記事で詳しく紹介している液体レンズ技術は、ラインカメラとの組み合わせで真価を発揮します。
液体レンズのピント切替時間は数ミリ秒〜十数ミリ秒であり、搬送時間内に余裕をもって完了します。以下に、固定焦点レンズと液体レンズのカバー範囲の違いを示します。
| 構成 | 対応可能な高さ変動幅 | F値の制約 | 搬送速度の制約 | コスト目安 |
|---|---|---|---|---|
| 固定焦点レンズ(F8) | 約50mm〜80mm | F8以上で被写界深度確保が必要 | 光量不足で1.0m/s程度が限界 | 低 |
| 固定焦点レンズ(F16) | 約100mm〜150mm | F16まで絞ると回折限界に近づく | 光量大幅不足、0.5m/s以下推奨 | 低 |
| 液体レンズ+固定レンズ | 300mm〜500mm以上 | F5.6〜F8で十分。開放寄りで使用可 | 2.0m/s以上でも対応可能 | 中〜高 |
| 複数固定焦点カメラ | 各カメラの被写界深度で分担 | 個別に設定可能 | 個別に最適化可能 | 高(台数分) |
上表からわかるとおり、液体レンズとの組み合わせは「1台のカメラで広い高さ変動をカバーしつつ、絞りを開放寄りに保って光量を確保する」という、物流ライン特有の二律背反を同時に解決する構成です。特にケース高さの変動幅が150mmを超える現場では、液体レンズの導入が費用対効果の面で最も合理的な選択肢となります。
撮像系を正しく設計しても、取得した画像をどう処理し、どうWMSに連携するかのデータフロー設計が不十分だと、現場運用に耐えるシステムにはなりません。ここでは、ラインカメラの画像取得からWMS登録までの一連のフローを整理します。
ラインカメラから出力される画像データは、エンコーダ同期で生成された高解像度のラスタ画像です。まず前処理として以下を実行します。
切り出されたラベル画像をVLM(Vision Language Model)に入力し、必要な情報を抽出します。VLAを活用した物流OCRの記事で解説しているように、VLMはテンプレート定義なしで多様なラベルフォーマットに対応できる点が最大の強みです。
推論は以下のいずれかの方式で実行します。
物流OCRのタクトタイム(1〜3秒/ケース)であれば、エッジ推論でも十分に対応可能です。
OCR結果は構造化データ(JSON等)に変換され、WMSへ送信されます。連携方式は現場の既存システムに応じて選択します。
OCR結果とWMS上の入荷予定データの突合(マッチング)処理も、このステップで実行します。マッチング結果に応じて、仕分けコンベアへのソート信号を出すところまでを自動化するケースが増えています。
ラインカメラの物流OCRシステムを導入する際によく遭遇するトラブルと、その原因・対策を整理します。
原因の切り分け:搬送方向のブレは、大きく分けて2つの原因があります。
※ 目安として、露光時間中の移動量が0.5ピクセル以下に収まるよう設計します。搬送速度2m/s、分解能0.1mm/pixelの場合、許容露光時間は0.05mm / 2000mm/s = 25マイクロ秒以下です。
原因の切り分け:光沢ラベルの正反射がカメラに直入射している(白飛び)か、照明のムラでラベルの端が光量不足(黒つぶれ)のいずれかです。
原因の切り分け:通過センサ(光電スイッチ)の検出位置とケースの形状・高さの関係を確認します。
原因の切り分け:撮像品質の問題とOCRモデルの問題を分離して考えます。
これらのトラブルの多くは、導入前の現場調査とサンプル画像検証の段階で予測・予防できます。Nsightでは、PoC前の無料画像診断でこれらのリスクを事前に洗い出し、PoC設計書に反映する運用としています。
カメラ本体の価格帯はエリアカメラと同等か若干高めですが、物流ラインでは1台のラインカメラで広範囲を高解像度にカバーできるため、複数台のエリアカメラを設置する構成に比べるとトータルコストは抑えられるケースが多いです。エンコーダや照明を含めたシステム全体での比較が重要です。
エンコーダ同期方式であれば、搬送速度の変動にリアルタイムで追従してライン周波数を調整するため、速度が一定でないラインでも歪みのない画像を取得できます。インバータ制御のコンベアや、起動・停止の繰り返しがある搬送ラインでも問題ありません。
ラインカメラで取得した画像は通常のラスタ画像として出力されるため、VLMに特別な前処理なしで入力できます。ただし、ラベル領域のクロップ処理を事前に行うことで推論速度と精度が向上します。Nsightではラベル検出とVLM推論を2段階で処理する構成を標準としています。
最大の注意点は照明設計の変更です。エリアカメラ向けのエリア照明はラインカメラには適さず、ライン照明への切り替えが必要です。また、エンコーダの追加設置とトリガー信号のタイミング設計も必要になります。Nsightでは既存構成の診断から移行設計まで一括で対応しています。