4. 共通設定

4.1. AIRead ControlPanelで設定

以下のプログラムを起動することで、AIRead ControlPanel(以下ControlPanel)にて共通設定ファイルを編集することができます。

<AIReadインストールフォルダ>/ControlPanel/AIReadControlPanel.exe

共通設定ファイル名は以下の通りです。
 座標指定、ルール指定 :AIRead_setting.ini
 全文OCR(定義なし):AIRead_setting_whole.ini

共通設定ファイルには“項目名=値”の書式で定義されます。

共通設定ファイルはUTF-8で保存する必要があります。

4.1.1. 基本設定

ファイルの入出力や抽出モードに関わる設定を行います。

No.内容項目名書式説明
1フォーマットフォルダPROFILE_CONFIG_DIR文字列フォーマット定義フォルダのパス
2入力フォルダINPUT文字列画像を取り込むフォルダパス
3出力フォルダOUTPUT文字列OCR結果を出力するフォルダパス
4処理成功移動先MOVE_SUCCESS_DIR文字列OCR処理に成功した画像を格納するフォルダパス
5処理失敗移動先MOVE_FAILED_DIR文字列OCR処理に失敗した画像を格納するフォルダパス
6アウトプットと帳票識別の単位FILE_IDENFICATION_TYPE0, 1, 2帳票を識別する単位
・0:ページ単位でアウトプット、帳票識別
 ページ単位で帳票を識別し、ページ単位で処理する
・1:ファイル単位でアウトプット、帳票識別は1ページ目のみ
 1ページ目で帳票を識別し、1ファイルすべてのページを1つの帳票として処理する
・2:ファイル単位でアウトプット、帳票識別はページ単位
 ページ単位で帳票を識別し、1ファイルすべてのページを1つの帳票として処理する
7OCR成功時に傾きを補正した画像を出力するCORRECT_MOVED_FILEtrue, falseチェック(true)の時、OCR成功時に成功フォルダ(MOVE_SUCCESS_DIR)に移動する画像を天地・傾き補正後画像にする
(位置合わせ補正は行われない)
8補正した画像の形式MOVED_FILE_FORMATPDF, JPEGCORRECT_MOVED_FILE が true の時に出力する画像のフォーマットを指定する
(デフォルト JPEG)

「複数ページの帳票ファイルを1つの帳票として処理する」を指定している場合は常にPDF出力となる
9アウトプットヘッダ情報の指定HEADER_ITEM文字列アウトプットファイルへ出力するヘッダ情報の項目とその順番を指定可能
※各項目の説明は6.1 共通を参照
10出力フォーマットOUTPUT_FORMATCSV
XML
CSV4DB
XMLWAGBY
SIMPLE_CSV SIMPLE_SEPARATE_CSV
SIMPLE_TXT SIMPLE_SEPARATE_TXT
OCR読取結果の出力形式を選択する
・CSV
・CSV4DB(DB連携のしやすいCSVフォーマット)
・XML
・XMLWAGBY(Wagbyフォーマット)
<全文OCRのみ>
・SIMPLE_CSV (画像の見た目に近い出力)
・SIMPLE_SEPARATE_CSV (画像の見た目に近い出力、表ごとに1つのCSVを出力)
・SIMPLE_TXT (SIMPLE_CSVのタブ区切りになったもの)
・SIMPLE_SEPARATE_TXT (SIMPLE_SEPARATE_CSVのタブ区切りになったもの)
※SIMPLE_CSV(TXT)・SIMPLE_SEPARATE_CSV(TXT)については4.4.4 表検出付全文OCRを参照
11出力文字コードOUTPUT_ENCODINGUTF-8
Shift_JIS
EUC-JP
UTF-8with BOM
出力ファイルの文字コードを選択する
(出力フォーマットがCSV、CSV4DBの場合)
12CSV出力時の出力項目の指定CSV_COLUMN_ITEM文字列CSVへ出力する項目とその順番を指定可能。 ※各出力項目の説明は6.2 CSVを参照
13優先モデルフォルダPRIORITY_MODEL_PATH文字列優先モデルフォルダとして指定するフォルダパス
※モデルは下記のフォルダ構成で配置すること※
 [優先モデルフォルダ]\tessdata\[任意のモデル]
指定したフォルダ内のモデルを優先して使用し、指定されたモデルが存在しない場合、共通のモデルフォルダから使用する
個別設定と組み合わせることで、帳票ごとに優先モデルと共通モデルの使い分けができる
14デバッグファイルを出力するIS_DEBUGtrue, falseチェック(true)の時、DEBUG_PATHで設定されたフォルダへデバッグ情報を出力する
15デバッグ出力先DEBUG_PATH文字列デバッグファイルを出力するフォルダパス
16出力ファイル名に日付時刻を付与するMOVED_FILE_NAME0,1チェック(1)の時、抽出処理完了後の出力ファイル名に日付時刻を付与する
17手書き画像の出力先HW_CUT_IMAGE_DIR文字列手書き項目/文字画像を出力するフォルダパス
18手書き項目画像を出力するCREATE_HW_COMP_IMAGEtrue, falseチェック(true)の時、手書きで座標指定した範囲の切取画像を出力する
19活字項目画像を出力するCREATE_PR_COMP_IMAGEtrue, falseチェック(true)の時、活字として読み取った範囲の切取画像を出力する
(デフォルト false)
20活字画像の出力先PR_CUT_IMAGE_DIR文字列活字項目画像を出力するフォルダパス
21表示用画像(PDF)を生成するCREATE_DISPLAY_IMAGEtrue, falseチェック(true)の時、データサイズを減らしたPDFを生成する
天地補正・傾き補正後(位置合わせ無し)の画像がPDFに埋め込まれる
入力ファイルが複数ページの場合、FILE_IDENFICATION_TYPEに関係なく複数ページのPDFを生成する
22表示用画像の出力フォルダDISPLAY_IMAGE_DIR文字列生成した表示用PDFを出力するフォルダパス
(デフォルト:指定なし、表示用画像(PDF)を生成する が有効のとき指定必須)
23表示用画像の品質DISPLAY_IMAGE_QUALITY1~100生成する表示用PDFの品質を指定する
指定した値が低いほど画像品質は下がるが、データサイズも小さくなる
(デフォルト 65)
24保管用画像を生成するCREATE_PRESERVATION_IMAGEtrue, falseチェック(true)の時、電子帳票保存法向けに保管用の画像を生成する
25保管用画像出力フォルダPRESERVATION_IMAGE_DIR文字列生成した電子帳票保存法向けの保管用画像を出力するフォルダパス
(デフォルト:指定なし、保管用画像を生成する が有効のとき指定必須)

「<」「>」「*」「?」「"」「|」「半角スペース」は使用不可
使用されていた場合は、自動的に除去される
任意の文字列以外に以下のタグも使用可能
<date>:システム日付(年月日の数字8桁 yyyymmdd)
<time>:システム時間(時間秒ミリ秒の数字11桁 hhmmssfffff)
<year>:システム日付(西暦の数字4桁 yyyy)
<month>:システム日付(月の数字2桁 mm)
<day>:システム日付(日付の数字2桁 dd)
26保管用画像のファイル名PRESERVATION_IMAGE_NAME文字列生成される電子帳票保存法向けの保管用画像のファイル名を指定する

「<」「>」「¥」「/」「:」「*」「?」「"」「|」「半角スペース」は使用不可
任意の文字列以外に以下のタグも使用可能
<date>:システム日付(年月日の数字8桁 yyyymmdd)
<time>:システム時間(時間秒ミリ秒の数字11桁 hhmmssfffff)
<year>:システム日付(西暦の数字4桁 yyyy)
<month>:システム日付(月の数字2桁 mm)
<day>:システム日付(日付の数字2桁 dd)
<inputfile>:読み取った対象のファイルから拡張子を除いた文字列
<item:項目名>:読み取りを行った際に、使用された帳票定義で指定されている項目名
(例えば、帳票定義で company_name と定義し、OCRにより実際の帳票から「アライズイノベーション株式会社」という文字列が取得されたとする。
この場合、保管用画像のファイル名の <item:company_name> の部分が「アライズイノベーション株式会社」に置換される)

4.1.2. 文字認識

文字認識に影響するパラメータを設定します。

No.内容項目名書式説明
座標指定
1OCR結果にスペースを含めるEXPORT_SPACEtrue, falseチェック(true)の時、OCR結果にスペースを含める
(活字読み取り時のみ)
2位置合わせ最大矩形の認識マージンFORMAT_MARGIN0以上位置合わせ時に大きな矩形を認識しない画像端(上下左右)からの範囲を指定する
単位はピクセル
(デフォルト 15)
3位置合わせ外接矩形の認識マージンFIX_TEXT_HEIGHT0以上位置合わせ時に外接矩形を認識しない画像端(上下左右)からの範囲を指定する
単位はピクセル
(デフォルト 100)
4活字のノイズ閾値PRINT_NOISE_FILTERS-1~100活字の認識で、項目中の最大文字高さに対して指定された閾値以下の文字をノイズとして除去する
例)
30 を指定 → 読み取り範囲内の最大文字に対し30%以下の高さの文字をノイズとみなして除去する
(デフォルト -1:本機能は動作しない)
※小さい文字や記号がノイズとして削除される可能性有り
5手書きノイズの閾値 (文字の高さ、複数文字指定時)HW_NOISE_FILTERS文字列手書き文字の認識で指定したモデルについて、項目中の最大文字高さに対して任意の割合以下の文字をノイズとして除去する
手書き文字の文字数を「複数」で設定した項目を対象とする
[モデル名]:[閾値(%)]の形式で記載する
カンマ区切りで複数指定可能
例) number:25,money:30
→ 数値モデルは25%、通貨モデルは30%の高さの文字をノイズとみなして除去する
※小さい文字や記号がノイズとして削除される可能性があります
6手書きノイズの閾値 (白画素の割合、1文字指定時)HW_WHITE_THRESHOLD0~1.0手書き項目に1文字指定をしているとき、 その項目画像を読取対象外(ノイズ)と判断する白ピクセルの割合と判断する閾値を指定する
例)
 0.99 を指定 → 手書き項目が1文字指定のとき、項目内の白ピクセルの割合が99%以上であれば、項目内の記載をノイズと判断して除去する
(デフォルト 0.975)
7改行を出力するRECOGNIZE_NEWLINEtrue,
false
チェック(true)の時、読み取り項目内の改行を認識して\nとして出力する
キーワード、キーワードの座標指定
8【明細】同一レコード判定EXTRACTION_RECORD_SEGMENT0,1同一レコードとみなす判定ロジックを選択。
・0:罫線区切り(デフォルト)
 罫線をまたいだ場合にレコードを区切る
・1:行区切り
 横に並んでいる文字列を1行としてレコードを区切る
9【明細】重複した明細を出力するEXTRACTION_OUTPUT_DUPLICATE_DETAILS0,1・0:重複した明細を出力しない
・1:重複した明細を出力する
 項目名、ページ番号、GID、RIDのすべてが一致する項目を重複とみなす
 同じ明細のテーブルが横に並んでいる場合に1を指定する
全体OCR(キーワード、キーワードの座標指定、型指定)
10使用するモデルOCR_ENGINETESSERACT
TENSORFLOW
ONNX
PYTORCH
使用するOCRエンジンを指定する
・TESSERACT:活字
・TENSORFLOW:手書き(v5.0.0以前のモデルを使用する場合)
・ONNX:手書き(CPUを使用する場合に指定)
・PYTORCH:手書き(GPUを使用する場合に指定)
11テキスト付きPDFでもOCRを実行するOCR_PDF_WITH_TEXTtrue, falseチェックあり(true):テキスト付きPDFの場合でもOCRを実行する
チェックなし(false):PDFのテキスト情報を使用して抽出する
12改善した文字列検知ロジックを使用するUSE_DL_STRING_DETECTIONtrue, falseチェック(true)の時、従来のOCRよりも文字列検知の改善した処理を行う
※メモリの使用量が約500MB程度増加し、処理時間がA4画像1枚当たり5秒/枚ほど増加する
※文字列検知の処理が従来のものと変更となるため、読み取り結果に影響する可能性有り
13行間隔が狭い文字列の精度改善STRING_DETECTION_SPLIT_LARGE_RECTANGLEtrue, falseチェックあり(true):行間隔の狭い文字列に対して、改善した文字検知を行う
チェックなし(false):従来の文字検知のまま処理を行う
14OCR結果から除外する文字リストBLACK_LIST_EXT文字列抽出処理時にキーワードおよび抽出する値から除外する文字を指定する
手書きモデル
15手書き用OCRモデルHAND_WRITE_OCR_LANG文字列指定された手書きモデルが存在しないときに使用するモデル名
"OCR_MODEL_PATH/tessdata/"以下に存在するフォルダ名
例)multi2_jpn
活字モデル
16活字用OCRモデルOCR_LANG文字列活字OCRエンジンで利用するモデル名
OCRモデルフォルダに存在するファイルの拡張子”.traineddata”を除外したファイル名を指定する
例)Japanese.traineddata → Japanese
17文字列の切取ロジックPAGE_SEG_MODE4, 6OCRエンジンの活字文字検知/分割アルゴリズムを指定する
・4 : 1行内の文字サイズが可変とみなして文字を検知
・6 : 1行内の文字サイズが固定とみなして文字を検知
18文字の多重認識を減らす処理を行うuse_dup_char_reducertrue, false複数の同じ文字が連続で出力されてしまうとき、本設定を有効にすることで回避できる(活字のみ)
※文字間が近い場合、複数文字を1文字として出力してしまう副作用が起きる可能性がある
・チェックする(true) : 機能を有効にする
・チェックしない(false) : 機能を無効にする
19対象文字種reduce_target0~4「文字の多重認識を減らす処理を行う(use_dup_char_reducer)」の対象となる文字種を指定する
・0 : 数字
・1 : 記号
・2 : ひらがな
・3 : カタカナ
・4 : アルファベット
 カンマ区切りで複数指定可能
20再読み込みの閾値RESCAN_THRESHOLD0~100指定した値よりもコンポーネントのConf値が閾値より低い場合に読み直す(活字のみ)
※コンポーネント内の文字のConf値の平均値
211つの文字列とみなす文字間隔(高さのN倍)LINKED_ITEM_THRESHOLD数値1つの文字列とみなす文字の間隔を設定
値は文字の大きさ(高さ)に対する倍率

4.1.3. 画像処理

文字認識の前に実施する画像処理関連の設定を変更します。

No.内容項目名書式説明
1傾き補正を行うIS_SLOPE_CORRECTIONtrue, falseチェック(true)の時、文字認識前に傾き補正を行う(35度まで)
2回転補正を行うAUTO_ROTATIONtrue, falseチェック(true)の時、文字認識前に90/180/270度の画像回転補正を行う
3直線除去を行う最短の長さLINE_REMOVAL_THRESHOLD0以上の整数直線とみなす長さのしきい値(ピクセル)
0の場合、文字の大きさから自動で設定する
4直線除去時の文字高さに対する倍率LINE_REMOVAL_MULTIPLE_BY_TEXT_HEGHT0.1以上の数値指定した値×文字高さの平均(ピクセル)が直線除去の対象となる
直線除去を行う最短の長さ の値が0の場合にのみ動作する
5点線除去を行う最短の長さHOUGH_THRESHOLD0以上の整数点線とみなす長さのしきい値(ピクセル)
6点線の間隔(横)ERODE_W0以上の整数横の点線として検知する点の間隔の値(ピクセル)
点と点の間隔が広い場合は大きい値を設定する
(デフォルト 12)
7点線の間隔(縦)ERODE_H0以上の整数縦の点線として検知する点の間隔の値(ピクセル)
点と点の間隔が広い場合は大きい値を設定する
(デフォルト 7)
8罫線除去で欠けてしまった文字の復元処理を行うRESTORE_TEXTtrue, falseチェック(true)の時、罫線除去時に欠けてしまう罫線と隣接した文字を復元する
※必ず復元できるわけではない
※副作用として文字にノイズがつく場合がある
9二値化の閾値THRESH_VALUE0~255文字認識前の画像の二値化(白黒化)のしきい値
0の場合、画像全体のヒストグラムから自動で設定する
詳細は4.4.1. 二値化の閾値を参照
10直線除去時の二値化の閾値BINTHRESH_ON_LINE_REMOVAL0~255直線除去時の二値化パラメータのしきい値
0の場合、画像全体のヒストグラムから自動で設定する
11短い罫線(横)除去の閾値SHORT_LINE_THRESH_H-1以上長い罫線に接している短い罫線(横)を検知・除去する閾値
罫線の長さ(ピクセル)を指定する
-1 : 除去を行わない
0 : 除去を行わない(-1と同じ)
1以上 : この値を直線検知の閾値とする
12短い罫線(縦)除去の閾値SHORT_LINE_THRESH_V-1以上長い罫線に接している短い罫線(縦)を検知・除去する閾値
罫線の長さ(ピクセル)を指定する
-1 : 除去を行わない
0 : 除去を行わない(-1と同じ)
1以上 : この値を直線検知の閾値とする
13短い点線も除去するUSE_SHORT_DOTLINE_REMOVALtrue, falseチェック(true)の時、短い罫線除去時に点線も除去対象とする
※処理時間がA4画像1枚当たり2秒ほど増加する
※文字が除去される副作用が発生する可能性がある
14細かいノイズ除去の閾値(幅)THIN_LINE_REMOVAL_THRESHOLD_W0以上指定した幅(ピクセル)より細かいノイズを除去する
値が大きいほど大きなサイズのノイズを除去する
(デフォルト 0、推奨値 3)
詳細は4.4.2. 細かいノイズ除去を参照
15細かいノイズ除去の閾値(高さ)THIN_LINE_REMOVAL_THRESHOLD_H0以上指定した高さ(ピクセル)より細かいノイズを除去する
値が大きいほど大きなサイズのノイズを除去する
(デフォルト 0、推奨値 3)
詳細は4.4.2. 細かいノイズ除去を参照
16細かいノイズ除去の縮小フィルタ(幅)ERODE_THIN_LINE_W1以上細かいノイズ除去の収縮処理のフィルターサイズ(幅)
値が大きいとより独立したノイズのみ除去する
(デフォルト 12)
詳細は4.4.2. 細かいノイズ除去を参照
17細かいノイズ除去の縮小フィルタ(高さ)ERODE_THIN_LINE_H1以上細かいノイズ除去の収縮処理のフィルターサイズ(高さ)
値が大きいとより独立したノイズのみ除去する
(デフォルト 7)
詳細は4.4.2. 細かいノイズ除去を参照
18TIFFを300DPIに変換してからOCRを実行するCONV_TIFF_DPItrue, falseチェック(true)の時、TIFFを300DPIに変換してからOCRを実行する
TIFFで縦横のDPIが異なる場合に指定する
19抽出する色EXTRACTION_COLORS文字列抽出する色を指定する(指定した色以外を除去する)
複数色を指定する場合はカンマ区切りで記載する
例) EXTRACTION_COLORS=K,R
指定可能な色
・K(黒)
・R(赤)
・Y(黄)
・G(緑)
・C(シアン)
・B(青)
・P(紫)
個別で指定する場合は、直接数値を指定
詳細は4.4.5. 色の抽出・除去を参照
20除去する色REMOVAL_COLORS文字列除去する色を指定する
指定方法は色抽出(EXTRACTION_COLORS)と同様
抽出する色と両方指定した場合は抽出を優先する
詳細は4.4.5. 色の抽出・除去を参照
21色抽出・除去を罫線除去の前に行うFILTER_COLOR_BEFORE_LINEREMOVALtrue, falseチェック(true)の時、罫線除去の前に色抽出・除去を行う
22罫線を延長する長さLINE_EXTENSION_LEN0以上検知した罫線を延長する
単位はピクセル
(デフォルト 0)
23矩形の丸い角を除去する閾値ROUNDED_CORNER_THRESHOLD0~100半径が指定した値未満の丸い角を除去する
単位はピクセル
0の場合は除去されない
(デフォルト 0)
詳細は4.4.3. 丸い角の除去を参照
24丸い角の除去範囲を拡張する長さROUNDED_CORNER_PADDING0~100丸い角を除去する際に、指定した値分の除去範囲を拡大する
単位はピクセル
(デフォルト 10)
詳細は4.4.3. 丸い角の除去を参照
25ドットの除去(背景・点線)を行うREMOVE_DOTtrue, falseチェック(true)の時、ドットの除去(背景、点線)を行う
(デフォルト false)
26除去したいドットの幅DOTLINE_SIZE_W0以上の整数削除したい背景や点線のドットのサイズの幅をピクセルで指定する
(デフォルト 3)
27除去したいドットの高さDOTLINE_SIZE_H0以上の整数削除したい背景や点線のドットのサイズの高さをピクセルで指定する
(デフォルト 3)
28罫線/点線削除の前にドットを削除REMOVE_DOT_BEFORE_LINEtrue/falseチェック(true)の時、罫線/点線削除の前にドットを削除する
(デフォルト true)
29小さい矩形を削除REMOVE_SMALL_RECTANGLEStrue, falseチェック(true)の時、小さい矩形の除去を行う
30除去する矩形の最小面積REMOVE_RECTANGLE_MIN_AREA_
THRESHOLD
0以上の整数小さい矩形を削除除去する」がチェック(true)の時に除去する矩形の最小面積を指定する
31除去する矩形の最大面積REMOVE_RECTANGLE_MAX_AREA_
THRESHOLD
0以上の整数小さい矩形を削除除去する」がチェック(true)の時に除去する矩形の最大面積を指定する
32斜め線を除去REMOVE_DIAGONAL_LINEStrue, falseチェック(true)の時、矩形内の斜めの線を除去する

33~37のパラメータは普段は折り畳まれておりますが、全て表示を押下することで表示されるようになります。
※パラメータ増加に伴い、使用頻度の低いパラメータがデフォルトで非表示になっています。

No.内容項目名書式説明
33ノイズ除去を行うDE_NOISEtrue, falseノイズ除去処理の有無
チェック(true)の時、文字認識前にノイズ除去を行う
34罫線除去を無効化するSKIP_LINE_REMOVEtrue, falseチェック(true)の時、文字認識前の罫線除去を無効化する(罫線除去は行わない)
35白黒反転処理を実施する黒の比率BLACK_WHITE_THRESHOLD0~100二値化後に白黒を反転するしきい値(%)
設定した%より黒の割合が多い場合に白黒を反転する
36シャープ補正値SHARPEN_VALUE0以上の少数OCR実行前に画像をシャープ化する
画像がぼやけている場合などに利用すると効果的
0の場合は処理しない
37ドット背景除去を行う(旧)REMOVE_DOTTED_BACKGROUNDtrue, falseチェック(true)の時、ドット背景除去を行う
※下位互換パラメータ

4.1.4. 後処理設定

読み取り完了後に行う処理全般を設定します。
作成された個別読取結果変換リストと読み取り項目との紐づけは、RuleEditor/FormEditor から行います。

No.項目名説明
1個別読取結果変換リストの保存先個別読取結果変換設定ファイルの保存先を指定する
デフォルトは、<AIREAD_HOME>\IDELibrary\OcrPostProcess
2変換リスト名選択中の個別読取結果変換設定ファイルが表示される
個別読取結果変換設定ファイルを追加する場合は、変換リスト名に入力した名前で追加される
3変換リスト名一覧作成済みの個別読取結果変換設定ファイルの一覧が表示される
4変換設定追加ボタン変換リストに入力した名称で個別読取結果変換設定ファイルを追加する
選択中の設定ファイル保存先に、同一の設定名の個別読取結果変換設定ファイルが存在する場合は追加不可
5変換設定削除ボタン選択中の個別読取結果変換設定ファイルを削除する
6変換リスト選択中の後個別読取結果変換設定ファイルの設定情報を表示する
7読取後に実行するコマンドライン文字列帳票の読み取り後に実行するコマンドライン文字列を設定する
4.1.4.1. 変換リストの設定
No.項目名説明
1変換対象(正規表現)変換対象の文字を指定する
変換対象の文字は正規表現で記載する
2変換後の文字変換対象の文字から変換する文字を指定する
変換後の文字は単語でも指定可能
4.1.4.2. 読取後に実行するコマンドライン文字列の設定

AIReadで帳票読み取りを行った後に、呼び出したいコマンドライン文字列を設定します。

例) 保管用画像を任意のフォルダへコピーするコマンド

copy /y "%AIREAD_PRESERVATION_FILE%" "任意のフォルダパス"

コマンドラインでは、AIRead独自の変数を使用することができます。
使用可能な変数と値については、下記を参照ください。

No.環境変数名内容呼び出されるパスの例
1AIREAD_ORIG_INPUT_FILEオリジナルの読取対象ファイルまでのフルパスC:\AIRead\debug\original\sample.pdf
2AIREAD_PRESERVATION_FILE保存用画像のファイルまでのフルパス
※基本設定タブで「保管用画像を生成する」が有効となっていることが前提
無効になっている場合は空文字列("")が設定される
C:\AIRead\preseve\20230320123456_アライズイノベーション_物品仕入れ_sample.pdf

4.1.5. 環境

ログ出力など環境に関する設定を変更します。

No.内容項目名書式説明
1GPUを使用するDEVICEcpu
gpu
文字認識処理でGPUを使用するかを指定する
・cpu:CPUを使用
・gpu:GPUを使用
2バッチサイズOCR_BATCH_SIZE整数文字認識処理で一度に処理をする件数を指定する
数値が大きいほど処理速度が速くなるが、メモリの消費量が多くなる
3ログ出力フォルダLOGS_PATH文字列実行ログを出力するフォルダパス
4ログ出力レベルLOGS_LEVEL0~3指定したレベルで以下の内容を出力する
・0 : DEBUG, INFO, WARNING, ERROR
・1 : INFO, WARNING, ERROR
・2 : WARNING, ERROR
・3 : ERROR
5ログ1ファイルあたりの
データサイズ
LOG_ROTATION_SIZE0~100ログ1ファイルあたりの最大サイズ(MB)
0 の場合、プロセス単位でログを出力する
6ログ全体のデータサイズLOG_MAX_SIZE0以上の整数ログファイルを保存する最大容量(MB)
0 の場合、制限なし(削除しない)
※LOG_ROTATION_SIZEより大きい値を設定すること

4.1.6. ファイル

共通設定ファイルファイルの新規作成、保存の操作ができます。

No.項目名説明
1新規新規で共通設定ファイルを作成する
2開く共通設定ファイルを指定して開く
3上書き保存編集中の設定を上書き保存する
4名前を付けて保存編集中の設定を別ファイルとして保存する
5履歴過去に保存した共通設定ファイルの履歴を表示する
選択することで対象ファイルを編集できる

4.2. 共通設定ファイルでのみ指定できる項目

No.項目名書式説明
1COMPONENT_LEVELMANUAL
ITEM
CELL
モードを指定する
・MANUAL : 座標指定、ルール指定
・ITEM : 全文OCR
・CELL : 全文OCR(表検出付き)
2AUTO_CROPStrue, falsetrueの場合、周囲の余白を削除する
3OCR_MODEL_PATH文字列OCRエンジンで利用するモデルのフォルダパス(tessdataが存在するフォルダ)
4OCR_MODE1OCRエンジンのOCRアルゴリズムを指定する

4.3. 項目/文字切り取り画像の出力

手書き項目画像を出力する機能が有効(CREATE_HW_COMP_IMAGE=true)、もしくは手書き文字画像を出力する機能が有効(CREATE_HW_CHAR_IMAGE=true)の際は、手書き画像の出力先(HW_CUT_IMAGE_DIR)の指定されたディレクトリにそれぞれの手書き画像を出力します。

?指定した出力先(HW_CUT_IMAGE_DIR)
├ ─ ─ ?char(手書きのみ)
│          ├ ? FileA.jpg_0_0.jpg
│          ├ ? FileA.jpg_0_1.jpg
│          ├ ? FileA.jpg_0_2.jpg
│          ├           ⁝
│          └ ? FileA.jpg_3_7.jpg

└ ─ ─ ?component(活字・手書き)
            ├ ? FileA.jpg_0.jpg
            ├ ? FileA.jpg_1.jpg
            ├ ? FileA.jpg_2.jpg
            └ ? FileA.jpg_3.jpg

項目(component)画像の数字は、同一入力ファイル中の連番です。
文字(char)画像の数字は、ファイル名で紐づく、項目画像ごとの連番です。

4.4. ユースケース

4.4.1. 二値化の閾値

OCRは画像を白と黒だけに変換(二値化)した状態で行います。各ピクセルの明るさ(黒0~255白)に対して、黒と白の境界とする値が二値化の閾値です。閾値は0~255を設定します。
二値化の閾値が低いと元の画像で濃い色のみが二値化で黒くなり、高いと薄い色でも黒くなります。
また、閾値を0とした場合は画像全体の明るさを基に自動で閾値を判定します。それによって目的の文字が消えてしまうなどあった場合は閾値を直接調整してください。

二値化の閾値の設定によって、下記画像のように変化します。

4.4.2. 細かいノイズ除去

細かいノイズ除去の閾値では、除去対象とするノイズの幅・高さを指定します。
どちらかのパラメータの対象となる場合は除去対象となります。

ControlPanel項目名共通設定ファイル項目名推奨値
細かいノイズ除去の閾値(幅)THIN_LINE_REMOVAL_THRESHOLD_W3
細かいノイズ除去の閾値(高さ)THIN_LINE_REMOVAL_THRESHOLD_H3

細かいノイズ除去の縮小フィルタは、近隣の文字・ノイズを結合して除去対象となるのを防ぎます。
結合する文字・ノイズ間の距離(ピクセル)を指定します。

ControlPanel項目名共通設定ファイル項目名推奨値
細かいノイズ除去の縮小フィルタ(幅)ERODE_THIN_LINE_W12
細かいノイズ除去の縮小フィルタ(高さ)ERODE_THIN_LINE_H7

4.4.3. 丸い角の除去

帳票によっては丸い角の矩形が存在し、直線除去では角が残ってしまい誤読の原因となる場合があります。
そういった場合に、下記のパラメータを設定することで丸い角の除去を行います。

ControlPanel項目名共通設定ファイル項目名推奨値
矩形の丸い角を除去するROUNDED_CORNER_THRESHOLD30
丸い角の除去範囲を拡張する長さROUNDED_CORNER_PADDING10

4.4.4. 表検出付全文OCR

コントロールパネルの抽出モードの設定で「キーワード指定(表検出付)」を指定した状態で全文OCRを実行すると、認識した罫線を基に表を検出し、表の各セルに対してOCRを行います。
この際、表の各セルのOCR結果は表の行・列の形に再現可能な情報が付与され構造化されます。ETL等で後続処理に表の情報を渡したい場合などにご利用ください。

なお、構造化情報の利用に応じて出力形式を選択可能です。
・付与された構造化情報含め出力したい場合: CSV形式
・構造化した表の形で出力したい場合: SIMPLE_CSV / SIMPLE_SEPARATE_CSV形式
 ※v2.3.1からタブ区切りのSIMPLE_TXT / SIMPLE_SEPARATE_TXT形式も追加されました

 ※表が段組みになっている場合には正しく構造化されません。
  行と列が揃っている表にのみ有効です。

4.4.5. 色の抽出・除去

帳票上の印影や背景の色がOCRに影響し、正しく読み取りを行えない場合があります。
OCRを行う前に、必要な文字の色のみ抽出、もしくは余計な色の除去を行って調整します。
色の指定はHSV色空間で範囲指定します。

4.4.5.1. HSV色空間について
要素指定範囲説明
H色相0~179具体的な色を定義する要素
色が環状で表現するため、0°と179°で同じ色となる
S彩度0~255色相で定義された色の鮮やかさ・濃さを表す要素
彩度が255で最も鮮やかとなり、減少に合わせて色が薄くなり、0で灰色になる
V明度0~255色相で定義された色の明るさ・暗さを表す要素
明度が255で最も明るく(白)、明度の減少に合わせて暗くなり、0で黒になる
4.4.5.2. 色の指定方法(GUI)
No.項目名説明
1指定した色カラーパレット、もしくはスポイトで対象とした色が表示される
2色の選択ボタンカラーパレットを開き、対象とする色を指定する
3スポイトボタンスポイト画面を開き、クリックした場所の色を抽出して対象とする
4色相対象とした色の色相の表示、または色相を直接入力する
5彩度対象とした色の彩度の表示、または彩度を直接入力する
6明度対象とした色の明度の表示、または明度を直接入力する
7±(指定幅)対象とした色の色相、彩度、明度に対して、指定した数値分の幅を上下に持たせる
指定された数値分の幅は、from-to の範囲となる
8色の対象範囲(from)対象とした色から±で指定した数値分をマイナスして表示する
9色の対象範囲(to)対象とした色から±で指定した数値分をプラスして表示する
10確定ボタン指定した色の範囲をAIRead ContorlPanel に反映させる
11キャンセルボタン編集内容を反映させずに、AIRead ContorlPanel へ戻る

例)赤い色の範囲を指定する場合(GUI)

対象の色の値に対して幅を持たせることで、近い色も対象とすることができます。

4.4.5.3. 色の指定方法(テキスト)

テキストで設定を行う場合、対象としたい色の色相、彩度、明度の順で”:”(コロン)で区切り、色の指定を行います。
色相が0°、彩度、明度が200を指定する際は、下記の指定となります。

0 : 200 : 200 - 0 : 200 : 200

色相に前後の幅を持たせ、さらに明るい色も対象としたい場合は、下記のような指定を行います。

-15 : 200 : 200 - 15 : 200 : 255
色相(-15 - 15)明度(200 - 255)
0から±15の値明度200より明るい色を取得するため、55プラスした値

※彩度を変更しない場合は、同じ値とします。

例)赤い色の範囲を指定する場合(テキスト)
純粋な赤色は、下記のように表現できます。

純粋な赤色の表現

0 : 255 : 255

実際は印刷等の条件により赤色の色合いは異なるため、範囲に幅を持たせることで色を対象とすることが可能です。
例)赤色を含むピンクからオレンジ色の範囲

-10:180:250-10:220:255

※色相 -10 は 170 と同義