KPMGコンサルティングの「KNIGHT(Knowledgeable Integrated Graphic Transformation、ナイト)」は、技術報告書や日報などの自然言語で書かれたデータを解析し、単語(トピック)同士の相関関係を分析・可視化するシステムである。

KNIGHTがアウトプットするグラフ表示の例。「テレビ」というトピックに関連するトピックのつながりをグラフ形式で見える化した
KNIGHTがアウトプットするグラフ表示の例。「テレビ」というトピックに関連するトピックのつながりをグラフ形式で見える化した
(出所:KPMGコンサルティング)
[画像のクリックで拡大表示]

 グラフデータベースと呼ばれる手法で、Web画面から検索・操作できる。「テレビ」などの調べたい単語を入力すると、「4K」や「大型」などの、元の単語を中心とした単語同士のつながりを、グラフ形式で表示する。単語の依存関係をたどることによって、それまで意識していなかった新たな知見を得られる、としている。

 インプットするデータとして、テキストファイルのほか、PowerPointなどのテキストが含まれる任意の文書ファイルを利用できる。グラフデータベースの作成に要する時間は、100Gバイトのデータを解析する場合に、GPU搭載PCで6時間程度としている。

 使い方は大きく2つある。1つは、トピックを指定して検索し、そのトピックを中心としたトピック同士のつながりを、グラフ表示する使い方。もう1つは、スタート地点となるトピックAと、ゴール地点となるトピックBを指定し、トピックAからトピックBへのつながりをグラフ表示する使い方である。

 検索によって得たグラフ表示画面は、対話型に操作できる。標準で、重要なトピックほど、大きく表示する。ユーザーは、個々のトピックの位置を、マウスで動かせる。関連するトピック同士の表示位置を1カ所にまとめることで、より分かりやすいグラフへと整形できる。個々のトピックをクリックすると、そのトピックを含む原文テキストを参照できる。

 KNIGHTの背景には、ユーザー企業において、非構造化データの活用が進んでいない、という状況がある。例えば、製造業では、図面ではなく試行錯誤の過程を記した報告書に知見がある。しかし、報告書はSQLで検索可能なERP(基幹業務システム)に登録していないため、活用する機会がない。

KNIGHT(Knowledgeable Integrated Graphic Transformation、ナイト)の概要
用途と機能技術報告書や日報などの自然言語で書かれたデータを解析し、単語(トピック)同士の相関関係をグラフデータベース化するシステム
提供形態コンサルティングサービスの一環として提供する
できることWeb画面から「テレビ」などの調べたい単語を入力すると、「4K」や「大型」などの、元の単語を中心とした単語同士のつながりを、グラフ形式で表示する。単語の依存関係をたどることによって、それまで意識していなかった新たな知見を得られる
グラフの種類使い方は大きく2つある。1つは、トピックを指定して検索し、そのトピックを中心としたトピック同士のつながりを、グラフ表示する使い方。もう1つは、スタート地点となるトピックAと、ゴール地点となるトピックBを指定し、トピックAからトピックBへのつながりをグラフ表示する使い方である
グラフの操作検索によって得たグラフ表示画面は、対話型に操作できる。標準で、重要なトピックほど、大きく表示する。ユーザーは、個々のトピックの位置を、マウスで動かせる。関連するトピック同士の表示位置を1カ所にまとめることで、より分かりやすいグラフへと整形できる。個々のトピックをクリックすると、そのトピックを含む原文テキストを参照できる
入力データインプットするデータとして、テキストファイルのほか、PowerPointなどのテキストが含まれる任意の文書ファイルを利用できる。グラフデータベースの作成に要する時間は、100Gバイトのデータを解析する場合に、GPU搭載PCで6時間程度としている
価格ケースバイケースだが、100Gバイトを超える程度のデータを解析する場合、コンサルティング費用は1カ月あたり1000万円弱程度
発表日2018年12月10日
提供開始日2018年12月10日