日立ソリューションズの「活文 知的情報マイニング」は、報告書などの大量の業務文書をAIで解析し、文章を構成する特徴的なキーワードを自動で抽出し、文書ファイル同士の関係を可視化するソフトである。ファイルサーバーにある過去の報告書といった大量の情報同士の関係性が分かる。

活文 知的情報マイニングの概要
(出所:日立ソリューションズ)
[画像のクリックで拡大表示]

 「ある単語が、どのような単語と一緒に、どのような順番で使われているか」など、単語の並び方や文脈を数値化してマッピングする仕組み。あらかじめ同義語や類似語の辞書を定義したり、学習のために正答データを準備したりする必要がない。これにより、短期間で導入できる。導入後のメンテナンス負荷も軽い。

 主な用途は、文書の分類である。大量の文書を、内容を解析した上で分類できる。また、キーワード検索にも利用できる。「質問文のキーワードとFAQのキーワードが一致しないために全文検索にヒットしない」という問題を解決できる。頭に浮かんだキーワードから必要なマニュアルや資料を見つけ出せる、としている。既存システムとデータ連携するためのWeb APIも提供する。

 現行版では、米Googleが開発した、自然言語処理の学習モデルを作成する手法「BERT」(Bidirectional Encoder Representations from Transformers)を採用している。Web上にある大量の公開文書を利用して事前学習したモデルを利用することで、高い精度で文書を分類できるとしている。ユーザーは、少量の教師データを追加学習させるだけで、BERTを利用できる。

活文 知的情報マイニングの概要
用途と機能報告書などの大量の業務文書をAIで解析し、文章を構成する特徴的なキーワードを自動で抽出し、文書ファイル同士の関係を可視化するソフト。ファイルサーバーにある過去の報告書といった大量の情報同士の関係性が分かる
仕組み「ある単語が、どのような単語と一緒に、どのような順番で使われているか」など、単語の並び方や文脈を数値化してマッピングする仕組み。あらかじめ同義語や類似語の辞書を定義したり、学習のために正答データを準備したりする必要がない
主なユースケース大量の文書を、内容を解析した上で分類できる。また、キーワード検索にも利用できる。「質問文のキーワードとFAQのキーワードが一致しないために全文検索にヒットしない」という問題を解決できる。頭に浮かんだキーワードから必要なマニュアルや資料を見つけ出せる
分類モデル現行版では、米Googleが開発した、自然言語処理の学習モデルを作成する手法「BERT」を採用している。Web上にある大量の公開文書を利用して事前学習したモデルを利用することで、高い精度で文書を分類できる。ユーザーは、少量の教師データを追加学習させるだけで利用できる
価格(税別)60万円から
発表日2019年11月25日
提供開始日2019年12月2日