オフィスの働き方改革で、ソフトウエアのロボット(ソフトロボ)でパソコン作業を自動化するRPA(ロボティック・プロセス・オートメーション)とともに注目を集めている技術がある。紙文書の文字を読み取ってテキストデータに変換するOCR(光学的文字認識)である。

 2つの技術を組み合わせると、「請求書や申請書といった紙文書の内容を読み取ってパソコンにデータとして入力する」というオフィスワーカーの繰り返し作業を自動化できる。具体的にはまず、紙文書を複合機などでスキャンして画像やPDF形式のデータにする。それをOCRにかけてテキストデータに変換する。このテキストデータをRPAのソフトロボが引き継ぐと、パソコンを使ってシステムにデータを自動入力できるようになる。

 OCRのうち、ここ1~2年で進化を遂げている技術が、AI(人工知能)技術を組み込んで、紙文書の手書き文字も読み取れるようにした「AI OCR」だ。ディープラーニング(深層学習)を使って、9割を超える精度で手書き文字を読み取れるなど、実用レベルに達している。

 手書き文字を読み取る主なAI OCRはCogent Labs(コージェントラボ、東京・港)の「Tegaki」、AI inside(東京・渋谷)の「DX Suite」、Arithmer(アリスマー、東京・港)の「ArithmerOCR」などがあるが、多くはクラウドサービスでの提供だ。手書き文字の画像をはじめとする学習データを集めやすく、継続して認識精度を高められるため、クラウドで提供するケースが多い。

「個人情報をクラウドとやり取りしたくない」

 こうしたなか、見逃せないのは、AI OCRの導入を望む企業や自治体からの声だ。「読み取りたい書類は顧客や住民の個人情報を多く含んでいる。手書き文字の画像データや読み取り結果はインターネット経由でクラウドとやり取りしたくない」――。「ITに不慣れな住民もいるから紙の申請書はなくせない」と話すある自治体はインターネットとは隔離された「LGWAN(総合行政ネットワーク)」経由でAI OCRのASPサービスを利用している。

 個人情報を含む紙文書の手書き文字の読み取りを、社内でできるようにするAI OCRが登場する。富士通子会社のPFUが2019年9月26日から販売を始めたパソコン向けOCRソフト「DynaEye 10」の機能強化版だ。

 具体的には、富士通のAI製品群「FUJITSU Human Centric AI Zinrai」が持つ手書き文字などを認識する技術を組み込んだ「AI日本語手書きOCRオプション」を加えた。出荷は2019年11月からを計画する。

「AI日本語手書きOCRオプション」の利用シーンの例。紙文書をスキャナーにかけると、オプションソフトなどを搭載したノートパソコンで手書き文字を読み取れる
[画像のクリックで拡大表示]

 特徴はパソコン上のAIで手書き文字を認識できるようにする点だ。「普通のパソコンで使えるようにして、請求書や申請書の画像データなどをクラウドサービスなどの『社外』に出すことなく、手書き文字を認識できる」と、PFUの泉真悟ソフトサービス・ソリューション事業本部ドキュメントソフトウエア企画部部長は説明する。税別価格はパソコンとスキャナー、DynaEye 10本体とAIオプションソフトのセットで100万円から。

この先は日経 xTECH Active会員の登録が必要です

日経xTECH Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。