富士通クラウドテクノロジーズの「データアセスメントレポート」は、ユーザー企業の生データを分析し、AIを活用できるかどうかを事前に診断するサービス。データから予測モデルを開発できるかどうかを評価する。評価の結果と、今後に向けたアドバイスをレポートにまとめて提供する。
ユーザー企業がAIを活用するためのステップは、データアセスメント、データの前処理、モデル開発、システム実装、運用開始、というものになる。「データアセスメントレポート」は、第1段階となるデータアセスメントを切り出して提供するサービスである。
扱うデータは、構造化データ(売上データ、センサーデータなど)と、非構造化データ(テキスト、音声、画像など)の両方。富士通クラウドテクノロジーズのデータサイエンティストがユーザー企業の生データを分析し、予測モデルの開発に適したアルゴリズムの選択肢を提案する。
具体的な診断の対象として、データベース定義書、データの量(全体レコード数、欠損・重複レコード数)、データの質(データの型、表記ゆれ、欠損割合)、を診断する。これらを診断した上で、AIモデルの開発に適した手法の選択肢を1~3個、手法の特徴とともに提示する。
サービスを提供する背景には、データを学習プログラムに投入すればAIを活用できるわけではない、という状況がある。扱うデータがAIに適した形になっているかどうかが鍵となる。しかし、実際には、データが「整理できていない」「汚い」「足りない」ことからプロジェクトが推進できなくなるケースが少なくない。
データアセスメントレポートの概要
用途と機能 | ユーザー企業の生データを分析し、AIを活用できるかどうかを事前に診断するサービス。データから予測モデルを開発できるかどうかを評価する。評価の結果と、今後に向けたアドバイスをレポートにまとめて提供する |
---|---|
サービスの実態 | 富士通クラウドテクノロジーズのデータサイエンティストがユーザー企業の生データを分析し、予測モデルの開発に適したアルゴリズムの選択肢を1~3個、手法の特徴とともに提案する |
扱うデータ | 構造化データ(売上データ、センサーデータなど)と、非構造化データ(テキスト、音声、画像など)の両方 |
診断の対象 | データベース定義書、データの量(全体レコード数、欠損・重複レコード数)、データの質(データの型、表記ゆれ、欠損割合) |
価格(税別) | 100万円 |
発表日 | 2019年8月29日 |
提供開始日 | 2019年8月29日 |