キヤノンITソリューションズの「DiscoveryBrain(ディスカバリーブレイン)」は文書検索システムである。企業内に点在している複数のストレージや文書管理システムを横断して検索できる。米Elasticsearchの全文検索エンジン「Elasticsearch」に、キヤノンITソリューションズの自然言語処理技術を組み合わせた。

文書同士が似ているかどうかの判断として、単語や類義語を共通して含んでいるかどうかなどを調べる
(出所:キヤノンITソリューションズ)
[画像のクリックで拡大表示]

 最大の特徴は、元の文書と似た別の文書を検索できること。単語や短文などのフレーズを検索条件に指定したキーワード検索だけでなく、指定した文書と内容が類似した文書を見つけ出す「類似文書検索(文書同士のマッチング検索)」ができる。

 検索キーワードを指定することなく、文書をそのまま、あるいは全文コピーして検索条件として指定できる。これにより、システムに入力した文書と類似した文書を検索できる。自然言語処理技術によって、検索対象となる文書の特徴を解析する仕組みである。同じ特徴を持った文書(内容が類似した文書)を見つけ出せる。

 文書同士が似ているかどうかの判断材料として、単語や類義語を共通して含んでいるかどうかなどを調べる。また、類似する単語をグループ化して分類名を付与する辞書機能も持つ。検索条件に単語やフレーズを指定した際に、単語やフレーズを含まない文書も検索結果に含められる。

類似する単語をグループ化して分類名を付与する辞書機能も備える
(出所:キヤノンITソリューションズ)
[画像のクリックで拡大表示]

 類似文書検索は次のような利用例を想定している。営業部門では、顧客から受領した提案依頼書と内容が似ている過去案件の提案書類を探し出せる。設計・製造部門では、作成した設計仕様を検索条件として、過去の関連文書と比較し、過去に課題となった箇所を把握してミスを未然に防ぐことができる。

 検索機能はAPIの形でも提供する。これを使って、自由に検索画面を構築できる。チャットボット連携用のテンプレートとして、L is Bが提供するビジネスチャットサービス「direc」も用意した。業務システム連携も個別に対応する。

DiscoveryBrain(ディスカバリーブレイン)の概要
用途と機能文書検索システム。企業内に点在している複数のストレージや文書管理システムを横断して検索できる。米Elasticsearchの全文検索エンジン「Elasticsearch」に、キヤノンITソリューションズの自然言語処理技術を組み合わせた
特徴元の文書と似た別の文書を検索できること。単語や短文などのフレーズを検索条件に指定したキーワード検索だけでなく、指定した文書と内容が類似した文書を見つけ出す「類似文書検索(文書同士のマッチング検索)」ができる
検索方法検索キーワードを指定するのではなく、文書をそのまま、あるいは全文コピーして検索条件として指定する
類似文書を検索できる仕組み自然言語処理技術によって、検索対象となる文書の特徴を解析する。同じ特徴を持った文書(内容が類似した文書)を見つけ出す。文書同士が似ているかどうかの判断材料として、単語や類義語を共通して含んでいるかどうかなどを調べる
APIの提供検索機能はAPIの形でも提供する。これを使って、自由に検索画面を構築できる
価格(税別)・年額420万円(サーバー1台で運用する場合)
・年額750万円(サーバー3台のクラスター構成で運用する場合)
発表日2020年8月26日
提供開始日2020年8月26日