7. 帳票設定管理画面

帳票定義のグループごとに紐づける帳票設定の作成・編集を行う画面です。
作成した設定は、定義グループへ紐づける必要があります。設定の紐づけは、6.1. 帳票設定の指定 を参照ください。


本画面で作成・修正できる設定は、帳票定義管理画面上の定義グループ単位のデフォルト設定のみです。
個別設定を追加・修正する場合は、CloudClientから再度アップロードを行ってください。
管理者ユーザでのみ表示される画面です。一般ユーザの画面には表示されません。

No.機能名説明
1抽出方式抽出方式を選択します。
※ルール指定が固定です。
2帳票設定名作成済みの帳票設定を選択します。
選択した帳票設定を編集できます。
3削除選択した帳票設定を削除します。
4保存選択した帳票設定のパラメータを最新の状態に保存します。
5名前を付けて保存変更したパラメータを名前を付けて新規保存します。

7.1. 抽出方式:ルール指定

7.1.1 基本設定

No.項目名説明
1アウトプットと帳票仕分けの単位帳票を仕分け、読み取りする単位を指定します。
ページ単位でアウトプット、帳票識別:ページ単位で帳票を識別し、ページ単位で処理する
ファイル単位でアウトプット、帳票識別は1ページ目のみ:1ページ目で帳票を識別し、1ファイルすべてのページを1つの帳票として処理する
2活字用OCRモデル活字の文字に対してOCRを行う時のモデル名を指定します。
デフォルトで使用可能
Japanese:ひらがな・カタカナ・漢字・アルファベット・数字・記号に対応
Latin:アルファベット・数字・記号に対応
Japanese_mod:Japaneseの対応文字種に加え、「㈱」「㈲」「〃」の環境依存文字に対応

個別学習モデルにアップロードした活字モデルを使用する場合、入力フィールドにモデル名を指定します。
3文字列の切取ロジックOCRエンジンの活字文字検知/分割アルゴリズムを指定します。
文字の大きさが可変:1行内の文字サイズが可変とみなして文字を検知
文字の大きさが均一:1行内の文字サイズが固定とみなして文字を検知
※「抽出モードの指定」がキーワード指定(表検出付き)の場合は、文字の大きさが均一
 を指定してください。
4再読み込みの閾値指定した値よりも読み取った文字の信頼値が低い場合に読み直しを行います。
5文字の多重認識を減らす処理を行う複数の同じ文字が連続で出力されてしまうとき、本設定を有効にすることで回避できます。
※本設定は活字にのみ対応です。
 文字同士の距離が近い場合、複数の文字を1文字として認識してしまう副作用を起こす可能性があります。

チェックあり:機能を有効にする
チェックなし:機能を無効にする
6対象文字種「文字の多重認識を減らす処理を行う」が有効な時に、対象文字種を限定できます。
数字:数字のみを対象とする
記号:記号のみを対象とする
ひらがな:ひらがなのみを対象とする
カタカナ:カタカナのみを対象とする
アルファベット:アルファベットのみを対象とする
7読取処理をする最大ページ数 読取処理をする最大ページ数を指定します。
  例)1を指定した場合、2ページ目以降は無視する
 0を指定した場合は全ページが読み取り対象となります。
※「アウトプットと帳票仕分けの単位」が「ファイル単位でアウトプット、帳票識別は1ページ目のみ」の場合のみ有効です。
 「ページ単位でアウトプット、帳票識別」の場合はすべてのページを読み取ります。

7.1.2. 画像処理

No.項目名説明
1ノイズ除去を行うノイズ除去処理の有無を設定します。
※ごみ除去ではありません。
チェックあり:文字認識前にノイズ除去を行う
チェックなし:ノイズ除去を行ずに処理を行う
2傾き補正を行う傾き補正を行います。最大約35度までの傾きに対応が可能です。
チェックあり:文字認識前に傾き補正を行う
チェックなし:傾き補正を行わずに処理を行う
3回転補正を行う(90度単位)回転補正を行います。90度単位で補正が可能です。
チェックあり:文字認識前に90/180/270度の画像回転補正を行う
チェックなし:回転補正を行わずに処理を行う
4罫線除去を無効化する罫線除去を無効化します。罫線除去が無効化されている場合、罫線もOCR対象となります。
チェックあり:文字認識前の罫線除去を無効化する(罫線除去は行わない)
チェックなし:文字認識前の罫線除去を行う(罫線除去を行う)
5直線除去を行う最短の長さ(ピクセル)直線とみなす長さのしきい値をピクセルで指定します。
指定した値よりも長い直線が除去対象となります。
0の場合、画像全体の文字高さ平均から自動で設定されます。
200が指定されている場合は、200ピクセルよりも長い直線が除去対象となります。
6直線除去時の文字高さに対する倍率指定した値×文字高さの平均(ピクセル)が直線除去の対象となります。
直線除去を行う最短の長さ の値が0の場合にのみ動作します。
7点線除去を行う最短の長さ(ピクセル)点線とみなす長さのしきい値をピクセルで指定します。
指定した値よりも長い点線が除去対象となります。
0の場合、画像全体の文字高さ平均から自動で設定されます。
500が指定されている場合は、200ピクセルよりも長い点線が除去対象となります。
8罫線除去で欠けてしまった文字の復元処理を行う罫線除去時に罫線と隣接と文字が隣接している場合や罫線と文字が被っている場合に欠けてしまった文字を復元します。
チェックあり:欠けた文字の復元を行う
チェックなし:欠けた文字の復元は行わない
※欠けた文字は必ず復元できるわけではありません。
 副作用として文字にノイズがつく場合があります。
9二値化の閾値文字認識前の画像の二値化(白黒化)パラメータの閾値を設定します。
0の場合、画像全体のヒストグラムから自動で閾値の反映が行われます。
10直線除去時の二値化の閾値直線除去時の二値化パラメータの閾値を設定します。
0の場合、画像全体のヒストグラムから自動で閾値の反映が行われます。
11白黒反転処理を実施する黒の比率(%)二値化後に白黒を反転する閾値の割合を設定します。
設定した%より黒の割合が多い場合に白黒を反転する処理を行います。
12シャープ補正値OCR実行前に画像をシャープ化する処理を行います。
画像がぼやけている場合などに利用するとシャープ補正の効果が得られます。
値が0の場合はシャープ補正の処理は行われません。
13短い罫線(横)除去の閾値長い罫線に接している短い罫線(横)を検知・除去する閾値を設定します。
直線除去を行う最短の長さ(ピクセル)」で除去される直線に両端が隣接している罫線のみ対象となります。
14短い罫線(縦)除去の閾値長い罫線に接している短い罫線(縦)を検知・除去する閾値を設定します。
直線除去を行う最短の長さ(ピクセル)」で除去される直線に両端が隣接している罫線のみ対象となります。
15短い点線も除去する(理時間がA4画像1枚当たり2秒ほど増加)短い罫線除去を行う時に、短い点線も除去対象とします。
チェックあり:短い点線も除去対象とする
チェックなし:短い点線は除去しない
※本機能が有効な場合、処理時間がA4画像1枚当たり2秒ほど増加します。
 また、文字の一部が除去される副作用が発生する可能性もあります。
16細かいノイズ除去の閾値(幅)指定した幅(ピクセル)より細かいノイズを除去します。
値が大きいほど大きなサイズのノイズを除去します。
17細かいノイズ除去の閾値(高さ)指定した高さ(ピクセル)より細かいノイズを除去します。
値が大きいほど大きなサイズのノイズを除去します。
18細かいノイズ除去の縮小フィルタ(幅)細かいノイズ除去の収縮処理のフィルターサイズ(幅)を指定します。
値が大きいとより独立したノイズのみを除去するようになります。
19細かいノイズ除去の縮小フィルタ(高さ)細かいノイズ除去の収縮処理のフィルターサイズ(高さ)を指定します。
値が大きいとより独立したノイズのみを除去するようになります。
20TIFFを300DPIに変換してからOCRを実行するTIFF画像が読み取り対象の時に、300DPIに変換してからOCRを実行します。
縦横のDPIの異なるTIFF画像が対象の場合に指定します。
チェックあり:TIFF画像を300DPIで変換する
チェックなし:TIFF画像の変換は行わない
21抽出する色抽出する色を指定します。指定した色以外は除去されます。
個別でカスタム色を指定する場合は、直接数値を入力してください。
22除去する色除去する色を指定します。
指定方法は「抽出する色」の指定方法と同様です。
※抽出する色と除去する色の両方を指定した場合、抽出する色が優先されます。
23色抽出・除去を罫線除去の前に行う罫線除去の処理の前に、色抽出・除去を行います。
通常は罫線除去 → 色抽出・除去 → OCR の処理順ですが、本機能が有効になっている場合、色抽出・除去 → 罫線除去 → OCR の順で処理を行います。
チェックあり:色抽出・除去を罫線除去よりも先に行う
チェックなし:従来通りの順番で処理を行う
24罫線を延長する長さ検知した罫線を内部的に延長する処理を行います。
値が0になっている場合は、延長処理が行われません。
25矩形の丸い角を除去する閾値半径が指定した値(ピクセル)未満の丸い角を除去する処理を行います。
値が0になっている場合は除去されません。
26丸い角の除去範囲を拡張する長さ丸い角を除去する際に、指定した値(ピクセル)分の除去範囲を拡大します。
矩形の丸い角を除去する閾値」の値が0、もしくは本機能の値が0になっている場合は、動作しません。
27ドット背景除去を行うドット背景除去を行います。
チェックあり:ドット背景の除去を行う
チェックなし:ドット背景除去を行わずに処理する
28ドットサイズ「ドット背景除去を行う」が有効であるとき、ドット背景除去時に削除するドットのサイズ(ピクセル)を指定します。
指定した値よりも縦横の大きさが小さいものが削除対象です。
29小さい矩形を削除小さい矩形の除去を行います。
チェックあり:小さい矩形の除去を行う
チェックなし:小さい矩形の除去は行わない
30除去する矩形の最小面積小さい矩形を削除除去」が有効であるとき、除去する矩形の最小面積を指定します。
31除去する矩形の最大面積小さい矩形を削除除去」が有効であるとき、除去する矩形の最大面積を指定します。
32斜め線を除去チェックあり:矩形内の斜めの線を除去する
チェックなし:斜め線の除去は行わない

7.1.3. ルール指定

No.項目名説明
1抽出モードの指定抽出モードを選択します。
キーワード指定
キーワード指定(表検出付き)
2テキスト付PDFでもOCRを実行するチェックの有無でテキスト付PDFの読み取り方法を変更します。
チェックあり:テキスト付きPDFの場合でもOCRを実行する
チェックなし:PDFのテキスト情報を使用して抽出する
3改善した文字列検知ロジックを使用するチェックありの時、従来のOCRよりも文字列検知の改善した処理を行います。
チェックあり:改善した文字列検知を使用する
チェックなし:従来の文字列検知を使用する
※処理時間がA4画像1枚当たり5秒/枚ほど増加します。
4行間隔の狭い文字列の精度改善チェックありのとき、行間隔の狭い文字列に対して、従来よりも改善した文字列検知を行います。
チェックあり:行間隔の狭い文字列に対しての改善した文字列検知を行う
チェックなし:従来の文字列検知のまま処理を行う
5OCR結果から除外する文字リストOCRを行った後に、キーワードおよび抽出する値から除外する文字を指定します。
61つの文字列とみなす文字間隔(高さのN倍)1つの文字列とみなす文字の間隔を設定します。
値は、文字の大きさ(高さ)に対する倍率を設定します。
7改善したスペース検出ロジックを使用するチェックありの時、従来のOCRよりも改善したスペース検出を行います。
チェックあり:スペース検知の改善した検出を行う
チェックなし:従来のスペース認識機能を使用する
8画像の解像度が大きい場合に小さくする画像の解像度が大きい場合(長辺が5000px以上)、画像を小さくしてからOCRを実行します。

7.2. 抽出方式:事前構築済みモデル

「請求書」「レシート」を選択した場合の抽出する項目や設定を指定します。

7.2.1. 項目名設定

No.項目名説明
1デフォルト項目名デフォルトの項目名
2種別修正画面のタブ
ヘッダ or 明細 or 税詳細
3説明項目の内容
4出力チェックありの項目を帳票画像から抽出して出力(帳票に存在している場合のみ)
チェックあり:出力する
チェックなし:出力しない
5変更後の項目名変更後の項目名
空の場合はデフォルトの項目名で出力

7.2.2. 基本設定

No.項目名説明
1取得できなかった項目は空で出力チェックあり:取得できなかった項目を空で出力
チェックなし:取得できなかった項目は出力しない

7.3. 抽出方式:事前構築済みモデル(Claude)

生成AI「Claudex.x」を使用する場合の抽出する項目や設定を指定します。
設定は「Claude3.5」と「Claude3.7」で共通で使用します。

7.3.1. 項目名設定

No.項目名説明
1項目名修正画面やCSVに出力する項目名を入力
2抽出パターン抽出したい項目の名称、説明、編集例を入力
3種類ヘッダ or 明細を指定
選択肢:ヘッダ、明細1、明細2、明細3
4後処理使用する後処理設定を指定
※後処理設定はAIReadCloudClientで設定してアップロードする
5インポートエクスポートしたjson形式のファイルを指定してインポートする
同じ設定名の設定が存在する場合は上書きする
6エクスポート表示している設定をjson形式のファイルでダウンロードする(設定名単位)

7.3.2. 全体設定

Claudeで読み取るすべての帳票に対して適用される設定です。

No.項目名説明
1回転補正を行う(90度単位)チェックあり:画像が回転している場合、正常な向きを自動で判定して補正する(処理時間が増える)
チェックなし:回転補正をしない
2読取ページ設定カンマ区切りで複数指定
ハイフン区切りで範囲指定
空欄の場合はすべてのページを読み取る
例)2,4-5,7- :1,3,6ページ以外を読み取る

7.3.3. 個別設定

設定名の単位で適用される設定です。

No.項目名説明
1プロンプトの自由記述欄全体に対する指示を記述可能。
例)表が複数ある場合は統合して1つのファイルで出力してください。
2ヘッダと明細を分けないチェックあり:ヘッダと明細を合わせて出力
チェックなし:ヘッダと明細を別々で出力

7.3.4. データ加工設定

明細項目について、条件に応じて以下の加工処理を設定できる機能です。

・項目の変換
・項目の移動/コピー
・行の削除

7.3.4.1 項目の変換

※画像は商品名に「値引き」と記載されている場合は金額にマイナスを付与する例

No.項目名説明
1種別変換
2変換前パターン文字列変換する文字を正規表現で記載する
3変換後パターン文字列「変換前パターン文字列」にマッチした文字をこの文字列に変換する
4データ加工条件変換するための条件をAND条件で複数設定可能
条件に該当しない場合は変換が行われない
5コメント説明を記載する
7.3.4.2 項目の移動/コピー

※画像は備考に値がある場合は商品名に移動する例

No.項目名説明
1種別移動/コピー
2移動(コピー)元項目名値を移動(コピー)する元となる項目
3移動(コピー)後項目名値を移動(コピー)する先の項目
4データ加工条件変換するための条件をAND条件で複数設定可能
条件に該当しない場合は変換が行われない
5コメント説明を記載する
7.3.4.3 行の削除

※画像は消費税より上にある「小計」や「中計」などの行を削除する例

No.項目名説明
1種別削除
2データ加工条件変換するための条件をAND条件で複数設定可能
条件に該当しない場合は変換が行われない
3コメント説明を記載する

7.3.5. 設定例

<読取結果(「ヘッダと明細を分けない」のチェックなし)>

<読取結果(「ヘッダと明細を分けない」のチェックあり)>

<設定名で仕分け>
設定名に帳票を識別する文字列を入れることで、使用する設定を自動で判別して出力することができます。

設定名を以下のように指定することで、会社単位で分けるといったことも可能です。
・○○株式会社の注文書
・××株式会社の注文書