世界初!教師データなしで高次元データの特徴を正確に獲得できるAI技術を開発

様々なAI技術の判断精度向上に貢献

 

 株式会社富士通研究所(注1)は、AIによる検知・判断における精度向上に向け、高次元データの分布・確率などの本質的な特徴量を正確に獲得するAI技術「DeepTwin(ディープツイン)」を世界で初めて開発しました。

 近年、様々なビジネスの領域において、膨大かつ多様なデータをAIで解析する需要が急激に増加しています。通常、AIの学習には大量の教師データが必要となりますが、教師データの作成に要する時間・工数などのコストがかかるため、正解ラベルを付与しない教師なし学習の必要性が増しています。しかし、通信や画像など、扱うデータが高次元の場合は、データの特徴を獲得するのが計算量の観点で困難なため、ディープラーニングを使って入力データの次元を削減する手法が用いられていました。ところが、この従来の手法では、次元削減後の空間における各データの分布や発生確率を考慮せずに削減していたため、入力データの正確な特徴量を捉えきれておらず、AIが誤った判定を行ってしまうといった問題がありました。

 今回、当社は、情報通信分野において長年培ってきた映像圧縮技術の知見とディープラーニングを融合させることで、高次元データの削減すべき次元数と次元削減後のデータの分布をディープラーニングで最適化し、データの特徴量を正確に抽出できるAI技術を開発しました。本技術により、AI分野の重要な課題の一つである、データの正確な分布や発生確率の獲得が可能となるため、異常データ検知など様々なAI技術の判断精度向上に貢献し、幅広いビジネス領域におけるAI適用が期待されます。

 本技術の詳細は、7月12日(日曜日)から開催される機械学習の国際会議「ICML 2020(International Conference on Machine Learning 2020)」にて発表します。

■開発の背景

 近年、様々なビジネスの領域において、膨大かつ多様なデータをAIで解析する需要が急増し、AIの活用がますます期待されています。例えば、ネットワーク経由で実行される通信アクセスにおいて、日々変化する未知の不正アクセスによる攻撃が問題となっていますが、膨大な通信アクセスデータから通常とは挙動が異なる不正アクセスを教師なし学習で自動的に検知する仕組みが求められています。また、甲状腺数値や不整脈データなどの医療データにおいても、一般的に異常データの症例が少ない上にバラつきが大きいことから、異常データの検知をAIでサポートすることが期待されています。

 ※以下は添付リリースを参照

 

 

リリース本文中の「関連資料」は、こちらのURLからご覧ください。

添付リリース

https://release.nikkei.co.jp/attach_file/0537556_01.pdf