画像ファイルとOCRで取得したテキストを入力作業に使用したい。帳票の種類は複数あるが対応可能か?
以下のようなお問い合わせをいただきました。
OCRシステムにて画像ファイルからテキストファイルを取得したが、すべての文字が読み取れているわけでもないので、エントリシステムにデータを取り込んで
・*や#、?などの不読文字の修正 ・ベリファイ入力 ・テキスト出力 を行いたい。可能であれば、 ・複数種類の帳票への対応 ・協力会社へ対応依頼するための個人情報の秘匿化 などについても対応の可否を教えてほしい。 |
というものです。
OCRシステムとデータエントリシステムの連携
OCRシステムは
・手書き文字
・印刷された文字 |
などの原票をイメージスキャナなどによりスキャニングし、
生成された画像データから文字データを得るためのシステム |
です。
データ入力作業が大幅に軽減できるということで導入されたというお話しを伺いますが、
OCRシステムで得られたテキストデータ、はすべて読み取れるわけではなく、データエントリシステムで得られる精度と同格ではありません。 |
その為、OCRシステムで得られたテキストデータは
・OCRシステムが読めない文字に対して出力した
* # ? などの不読文字の修正 ・ベリファイ入力 ・テキスト出力 を行うことでデータエントリシステムにて得られるレベルの出力データ |
になります。
当社製品における対応
当社製品は、OCRをはじめとしたテキストと該当するイメージデータを取り込み、
・不読文字の修正 ・ベリファイ入力 ・比較入力(マッチング) ・画像分割システムと連動させた、秘匿化
|
などを行うことができ、自由度のある処理フローを構築することができます。
様々な経験から処理フローについてのご提案できますので、
お気軽に
または お電話にてお問い合わせください。
|
関連する製品も併せてご参照ください。