東芝デジタルソリューションズの「AI OCR文字認識サービス」は、クラウド型で使えるOCR(光学文字認識)サービスである。OCR機能をWeb APIの形で提供する。開発中のアプリケーションにAPIを組み込むことによって、アプリケーションの中でOCR機能を利用できる。

帳票識別APIの概要。(A)イメージファイルと識別情報(識別したい画像中の座標、用語)を送信すると、識別結果が返る。(B)イメージファイルと帳票識別番号を送信すると、合致する識別番号が返る
(出所:東芝デジタルソリューションズ)
[画像のクリックで拡大表示]

 APIとして、画像に含まれる文字を認識する文字認識用のAPIと、申請書や届け出書といった帳票の種類を識別する帳票識別用のAPIを提供する。アプリケーションからAPI経由で文字を認識できるだけでなく、アプリケーションからAPI経由で帳票の種類を識別できる。

 OCRの認識精度を高める工夫として、深層学習を活用している。文字の認識に活用しているだけでなく、画像の処理(ケイ線の除去、取り消し線の判別、訂正印の判別)にも活用している。これにより、取り消し線や訂正印を読み飛ばせる。イメージスキャン時に画像が劣化しても、ある程度は読み取れる。

 申込書や申請用紙などに多い「1枠1文字」の書式に対する認識精度を高める機能も搭載している。認識過程で誤読の可能性がある箇所については「?」で結果を返す。「?」以外の部分の文字認識精度は99.7%と高いため、実運用においては、認識結果の「?」部分だけを確認・訂正するだけで済む。

誤読抑制OCR技術の仕組み。認識過程で誤読の可能性がある箇所は「?」で結果を返す。実運用においては、認識結果の「?」部分だけを確認・訂正するだけで済む
(出所:東芝デジタルソリューションズ)
[画像のクリックで拡大表示]
AI OCR文字認識サービスの概要
用途と機能クラウド型で使えるOCR(光学文字認識)サービス。OCR機能をWeb APIの形で提供する。開発中のアプリケーションにAPIを組み込むことによって、アプリケーションの中でOCR機能を利用できる
提供するAPI・文字認識用のAPI。画像に含まれる文字を認識する
・帳票識別用のAPI。申請書や届け出書といった帳票の種類を識別する
OCRの認識精度を高める工夫深層学習を活用している。文字の認識に活用しているだけでなく、画像の処理(ケイ線の除去、取り消し線の判別、訂正印の判別)にも活用している。これにより、取り消し線や訂正印を読み飛ばせる。イメージスキャン時に画像が劣化しても、ある程度は読み取れる
「1枠1文字」の認識精度を高める機能申込書や申請用紙などに多い「1枠1文字」の書式に対する認識精度を高める機能を搭載している。認識過程で誤読の可能性がある箇所については「?」で結果を返す。「?」以外の部分の文字認識精度は99.7%と高いため、実運用においては、認識結果の「?」部分だけを確認・訂正するだけで済む
価格(税別)・1カ月1万枚または10万項目のいずれかに達するまでの読み取りで月額30万円。初期構築費用は90万円
・オンプレミス版も用意している。オンプレミス版は都度見積もり
発表日2021年1月21日(帳票識別APIを追加したV2.5)
提供開始日2021年1月21日(帳票識別APIを追加したV2.5)