1.2. 使用する用語

・帳票定義

OCRをかけ、データ化されたものから、必要なデータのみを抽出するための設定です。帳票の読み取りには、必ず設定する必要があります。

・学習モデル
– 活字OCR用学習モデル

活字にOCRをかけ、データ化する際に使用するファイルです。手書き文字をデータ化することはできません。

– 手書き文字OCR用学習モデル

手書き文字にOCRをかけ、データ化する際に使用するファイルです。活字モデルと比較すると精度は劣りますが、活字文字もデータ化することが可能です。

・Edition
– 座標

定型の帳票のデータ化に適した機能です。手書き/活字の両モデルに対応しています。
FormEditorで定義を作成し、アップロードします。

– ルールv1

非定型の帳票にOCRをかけ、データ化する際に適した機能です。手書き/活字の両モデルに対応しています。
RuleEditorで定義を作成し、アップロードします。

– ルールv2

定型の帳票のデータ化に適した機能です。手書き/活字の両モデルに対応しています。
FormEditorで定義を作成し、アップロードします。
読み取り方法で「キーワード」「型指定」「キーワード座標指定」を使用した場合に「ルールv2」となります。

・共通設定ファイル

OCRをかける際に、使用する設定ファイルです。フォルダパスの指定やデータ抽出のチューニングを行います。

・AIRead FormEditor

座標・ルールv2の機能で帳票を読み取る際に使用します。帳票定義の作成・チューニングを行うためのGUIです。

・AIRead RuleEditor

座標・ルールv1の機能で帳票を読み取る際に使用します。帳票定義の作成・チューニングを行うためのGUIです。

・AIRead ControlPanel

共通設定ファイルの作成・チューニングを行うためのGUIです。ライセンスの登録・更新、ユーザ認証の設定もこちらのツールで行います。

・AIREAD_CLOUD_HOME

AIRead が使用するシステム環境変数です。AIRead のインストール先が、AIREAD_CLOUD_HOMEとなります。インストール時に作成されるため、事前に設定する必要はありません。