5. 出力

OCRの結果をOUTPUTフォルダへ出力します。

5.1. 共通

すべての形式で出力される項目です。

No.項目名説明
1Imageファイル名(複数ページファイルの場合はページ分割後)
2Image_jshfilenameファイルパス(処理成功/失敗移動先)
3modifyDateインプットファイルの更新日時
yyyy-MM-ddThh:mm:ss
4processDate処理完了日時
yyyy-MM-ddThh:mm:ss
5resulttrue:処理成功
false:処理失敗
6originalinputファイル名
7original_jshfilenameinputファイルパス(デバッグフォルダ内へ移動)
8Image_for_display表示用画像の絶対パス
表示用画像の生成時に自動でヘッダ項目に追加される
複数ページ画像が入力の場合、最終ページのCSVにのみ記載される(表示用画像は複数ページ画像が入力の場合、常に複数ページPDFを生成するため)

※共通設定ファイルにて出力する項目の変更が可能です。

デフォルト:HEADER_ITEM= Image, Image_jshfilename, modifyDate, processDate, result

5.2. CSV

AIRead独自のCSV形式で出力されます。

  • OUTPUT_FORMAT:CSV
  • 項目:
No.項目名説明
1ItemName項目名
2Page該当のメタデータが出現するページの番号(0 開始)
3GIDフォーマット定義ファイルで指定したグループID
4RIDフォーマット定義ファイルで指定したレコードID
5Value取得した値
6conf文字認識の信頼度
値が大きいほど正解している可能性が高い(MAX100)
※チェックマークの場合はテンプレート領域に対する黒領域の割合(数値)
7x抽出範囲の左上の点のx座標(ピクセル)
8y抽出範囲の左上の点のy座標(ピクセル)
9w抽出範囲の幅(ピクセル)
10h抽出範囲の高さ(ピクセル)
11ImagePathコンポーネント画像のパス
CREATE_HW_COMP_IMAGE=falseの場合の値はnull
12TableName明細名(座標指定ではGIDと同じ値が自動的に出力されます)

※共通設定ファイルにて出力する項目の変更が可能です。

デフォルト:CSV_COLUMN_ITEM=ItemName,Page,GID,RID, Value,conf,x,y,w,h

  • 出力イメージ:
"ItemName","Page","GID","RID","Value","conf","x","y","w","h"
"Image","-1","-1","-1","sample1.jpg","-1","-1","-1","-1","-1"
"Image_jshfilename","-1","-1","-1","C:\AIRead\success\sample1.jpg","-1","-1","-1","-1","-1"
"modifyDate","-1","-1","-1","2018-08-16T18:10:27","-1","-1","-1","-1","-1"
"processDate","-1","-1","-1","2018-08-25T00:28:27","-1","-1","-1","-1","-1"
"result","-1","-1","-1","true","-1","-1","-1","-1","-1"
"id","0","","-1","order","100","-1","-1","-1","-1"
"tok_cd","0","","-1","100","97","307","688","510","170"
"Tel","0","","-1","03-2345-6789","95","307","951","1450","170"
"Month","0","","-1","10","97","307","1207","200","170"
"Day","0","","-1","31","99","620","1207","200","170"
"haikb","0","","-1","1","99","938","1207","85","170"
"timekb","0","","-1","3","99","1350","1207","85","170"
"Itemcd0","0","detail","0","123","100","407","1745","627","170"
"Amount0","0","detail","0","30","100","2015","1745","623","170"
"Wrapping0","0","detail","0","20","100","2687","1745","314","170"

5.3. CSV4DB

一般的なカンマ区切りのCSV形式です。
1ページ1行で出力します。

  • OUTPUT_FORMAT: CSV4DB
  • 出力イメージ:
"id","tok_cd","Tel","Month","Day","haikb","timekb","Itemcd0","Amount0","Wrapping0"
"order","100","03-2345-6789","10","","","","123","30","20"

5.4. XML

XML形式で出力します。

  • OUTPUT_FORMAT: XML
  • 項目:
No.項目名説明
1field 
2id項目名
3conf文字認識の信頼度
値が大きいほど正解している可能性が高い(MAX100)
※チェックマークを指定している場合はテンプレート領域に対する黒領域の割合(数値)
4x抽出範囲の左上の点のx座標(ピクセル)
5y抽出範囲の左上の点のy座標(ピクセル)
6width抽出範囲の幅(ピクセル)
7hight抽出範囲の高さ(ピクセル)
8value取得した値
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<order>
  <Image>sample1.jpg</Image>
  <Image_jshfilename>C:/AIRead/success/sample1.jpg</Image_jshfilename>
  <modifyDate>2018-08-16T18:10:28</modifyDate>
  <processDate>2018-10-22T20:51:21</processDate>
  <result>true</result>
  • 出力イメージ:
 <id>order</id>
<field conf="98" height="170" id="tok_cd" width="510" x="307" y="688">
    <value>100</value>
 </field>
 <field conf="97" height="170" id="Tel" width="1450" x="307" y="951">
    <value>03-2345-6789</value>
  </field>
  <field conf="99" height="170" id="Month" width="200" x="307" y="1207">
    <value>10</value>
  </field>
  <field conf="100" height="170" id="Day" width="200" x="620" y="1207">
    <value/>
  </field>
<field conf="100" height="170" id="haikb" width="85" x="938" y="1207">
    <value/>
 </field>
 <field conf="100" height="170" id="timekb" width="85" x="1350" y="1207">
    <value/>
 </field>
 <detail>
    <row id="0">
      <field conf="99" height="170" id="Itemcd0" width="627" x="407" y="1745">
        <value>123</value>
      </field>
      <field conf="99" height="170" id="Amount0" width="623" x="2015" y="1745">
        <value>30</value>
      </field>
      <field conf="99" height="170" id="Wrapping0" width="314" x="2687" y="1745">
        <value>20</value>
      </field>
    </row>

5.5. XML for WAGBY

 AIRead Screen Designer(Wagby)との連携が可能なXML形式で出力します。
 ※”Wagby”とはノンプログラミングでWeb業務アプリケーションを開発できるツールです。

  • OUTPUT_FORMAT: XMLWAGBY
  • 項目:
No.項目名説明
1[ItemName]_conf文字認識の信頼度
値が大きいほど正解している可能性が高い(MAX100)
※チェックマークの場合はテンプレート領域に対する黒領域の割合(数値)
  • 出力イメージ:
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<order>
  <Image>sample1.jpg</Image>
  <Image_jshfilename>C:/AIRead/success/sample1.jpg</Image_jshfilename>
  <modifyDate>2018-08-16T18:10:28</modifyDate>
  <processDate>2018-10-22T21:00:08</processDate>
  <result>true</result>
  <id>order</id>
  <id_conf>100</id_conf>
  <tok_cd>100</tok_cd>
  <tok_cd_conf>98</tok_cd_conf>
  <Tel>03-2345-6789</Tel>
  <Tel_conf>97</Tel_conf>
  <Month>10</Month>
  <Month_conf>99</Month_conf>
  <Day/>
  <haikb/>
  <timekb/>

  <detail>
    <Itemcd0>123</Itemcd0>
    <Itemcd0_conf>99</Itemcd0_conf>
    <Amount0>30</Amount0>
    <Amount0_conf>99</Amount0_conf>
    <Wrapping0>20</Wrapping0>
    <Wrapping0_conf>99</Wrapping0_conf>
  </detail>