日立製作所の「Data Preparation Service」は、データ分析前に必要なデータの整形・加工作業をAIで効率化するシステムを構築し提供するサービスである。Webシステムをユーザー企業のオンプレミス環境に構築し、これを課金型のサービスとして提供する。

Data Preparation Serviceの概要
(出所:日立製作所)
[画像のクリックで拡大表示]

 これまで膨大な工数を必要としていたデータの整形・加工作業を、AIによって高度化する。熟練者が持つプログラミングや統計のスキルがなくても、高品質で効率的なデータの前処理できるとしている。前処理の作業負荷を軽減することで、本来時間と工数をかけるべき分析作業に集中できる。

 背景には、IoTデータのような異種混合データをビジネスに活用するニーズが高まっていることがある。現場で生成するデータには項目の定義情報がないことなどから、データの活用にあたってデータ形式の統一や、類似データの統合といった前処理が不可欠になる。

 データの前処理では、データの仕様を特定する「データ理解」と、仕様に基づいてクレンジングや統合を試行する「データ加工の検討・検証」のプロセスを繰り返す。こうして作成した前処理のロジックを、ETL(抽出/変換/登録)ツールで実行してデータを加工・変換する。

 Data Preparation Serviceは、データの仕様を理解するための機能を提供する。データの項目名をAIで推測する機能、形式を統一・変換する必要があるデータや不要なデータを可視化する機能、データ間の関連性を各データの特徴量から判断する機能、などを提供する。

 さらに、「データ加工の検討・検証」に必要な作業を効率化する機能として、データの加工方法を共有する機能を提供する。あらかじめ登録してある標準的なロジックに加えて、よく使われる汎用的なロジックや熟練者の専門ロジックをチームやプロジェクト内で共有できる。

 データ仕様の理解からロジックの検証までの一連の作業は、コーディング作業を必要とせず、GUI画面で実行できる。また、前処理ロジックを任意のETLツールに連携させる機能も提供する。ETLツールに対してロジックを個別に実装する手間なく、データの前処理をETLで実行できる。

Data Preparation Serviceの概要
用途と機能データ分析前に必要なデータの整形・加工作業をAIで効率化するシステムを構築し提供する。Webシステムをユーザー企業のオンプレミス環境に構築し、これを課金型のサービスとして提供する。
具体的な機能■データの仕様を理解するための機能を提供する。データの項目名をAIで推測する機能、形式を統一・変換する必要があるデータや不要なデータを可視化する機能、データ間の関連性を各データの特徴量から判断する機能、などを提供する
■前処理のロジック(データの加工方法)を検討・検証する作業を効率化する機能として、データの加工方法を共有する機能を提供する。あらかじめ登録してある標準的なロジックに加えて、よく使われる汎用的なロジックや熟練者の専門ロジックをチームやプロジェクト内で共有できる
ETL連携機能前処理ロジックを任意のETLツールに連携させる機能を提供する。ETLツールに対してロジックを個別に実装する手間なく、データの前処理をETLで実行できる
価格個別見積もり
発表日2019年10月2日
提供開始日2019年10月2日