手書き文字認識精度を飛躍的に向上させたAI OCR文字認識サービスV2.0の提供を開始

〜50年以上のOCR技術の開発ノウハウに、ディープラーニング技術を融合〜

 

 東芝デジタルソリューションズ株式会社(以下、当社)は、クラウド型OCR「文字認識サービス」の新バージョンとして、申請書や届出書などに記載された手書き文字列の認識精度を飛躍的に向上させた「AI OCR文字認識サービスV2.0(以下、AI OCR V2.0)」の提供を本日から開始します。ディープラーニング技術を活用した文字認識エンジンの搭載により、乱雑に書かれた手書き文字やつづけ字もさらに高精度に認識できるようになりました。

 近年、OCR(光学的文字認識)は多様化した書類のデータ化の要望に応えるため、認識精度の向上などの技術的な進化やRPA(ソフトウェアロボット)との組み合せによる業務効率化が期待されています。そのような中、当社は、機械学習などのAI技術を含む50年以上のOCR関連技術の開発成果と業務適用ノウハウを持ち(注1)、ハードウェア型/ソフトウェア型のOCRを長年提供しています。2019年1月からは、読み取る範囲のマウス指定や読み取る項目のキーワード登録など、簡単な操作で、活字・手書き文字の読み取り・データ化をサポートするクラウド型OCR「文字認識サービス」の提供を開始し(注2)、RPAと連携したサービスも提供しています(注3)。

 今回リリースするAI OCR V2.0では、当社の長年のOCR技術と業務適用ノウハウに、当社が得意とするディープラーニング技術を組み合わせることで、手書き文字列の読み取り精度を大幅に向上しました(注4)。ディープラーニング技術を活用した文字認識エンジンの搭載により、これまで読み取りが難しかった乱雑に書かれた「接触文字」や「枠線にかかった文字」や、文字がつながった「つづけ字」なども、高い精度で認識できるようになり、誤認識率が従来に比べ半減しました(注5)。

 また、当社OCR技術の強みである帳票を自動で識別し仕分ける機能をAI OCR V2.0にも搭載し、利便性を高めました。

 ※以下は添付リリースを参照

 

 

リリース本文中の「関連資料」は、こちらのURLからご覧ください。

添付リリース

https://release.nikkei.co.jp/attach_file/0527945_01.pdf