クオリカの「XLake(エックスレイク)」は、データレイクを運用するためのPaaS型クラウドサービスである。構造化データに加えて、IoTセンサーデータや各種ログデータなどの非構造化データを収集して分析できる。クオリカのエンジニアによるデータ分析支援サービスをセットにして提供する。

「XLakeサービス」の全体像
(出所:クオリカ)
[画像のクリックで拡大表示]

 PaaSサービスとして(1)データを保管する「XLakeストレージ」、(2)データを事前処理して収集する「XLakeデータフロー」、(3)蓄積したデータの分析基盤「XLakeアナリシス」の3つを提供する。この上で(4)ストレージに蓄積したデータをクオリカのエンジニアが分析する「XLakeプロフェッショナル」を提供する。

 (1)のXLakeストレージは、構造化データに加え、音声、画像、ログなどの非構造化データを保管できる。企業が生成したデータを、本来のフォーマットのままで保管する。保管容量は無制限で、利用量(1Tバイト単位)で契約する。VPN接続でデータを格納できる。この場合、SMB/NFS、FTP/HTTP、HDFSなどのプロトコルでアクセスできる。

 (2)XLakeデータフローは、データをXLakeストレージに保管する前段階で、分析に必要な事前のデータ処理を行えるサービスである。例えば、ログデータを構造化するなど、ユーザーが必要とする形式でXLakeストレージに格納できる。処理量(1Tバイト単位)で契約する。プル型でデータを取りにいくフロー(SFTP/HTTP/JDBC)と、プッシュ型でデータを受け取るフロー(HTTP/MQTT/Apache Kafka)のいずれも利用できる。

 (3)XLakeアナリシスは、XLakeストレージに保管したデータを分析する基盤である。複数のノードで分散処理できる。データ分析ミドルウエアとして、SQLクエリーを利用できるApache Hiveと、機械学習を利用可能なApache Sparkの利用環境を提供する。いずれも、処理性能に応じた契約となる。

 Apache Hiveを使うと、JDBC/ODBC接続を介してデータレイク内のデータをSQLで分析できる。Hiveと接続できるBI(ビジネスインテリジェンス)ソフトと連携すれば、データレイク内のデータをBIソフトで可視化できる。一方、Apache Sparkでは、4つのライブラリ(SparkSQL、SparkStreaming、Mlib、raphX)を利用できる。ETL(抽出/変換/登録)、ストリーミング処理、機械学習など、各種の用途に活用できる。

XLake(エックスレイク)の概要
用途と機能データレイクを運用するためのPaaS型クラウドサービス。構造化データに加えて、IoTセンサーデータや各種ログデータなどの非構造化データを収集して分析できる。クオリカのエンジニアによるデータ分析支援サービスをセットにして提供する
PaaSサービスの構成データを保管する「XLakeストレージ」、データを事前処理して収集する「XLakeデータフロー」、蓄積したデータの分析基盤「XLakeアナリシス」の3つを提供する
データ分析支援サービスストレージに蓄積したデータをクオリカのエンジニアが分析するサービス「XLakeプロフェッショナル」を用意した
XLakeストレージの概要構造化データに加え、音声、画像、ログなどの非構造化データを保管できる。企業が生成したデータを、本来のフォーマットのままで保管する。保管容量は無制限で、利用量(1Tバイト単位)で契約する。SMB/NFS、FTP/HTTP、HDFSなどのプロトコルでアクセスできる
XLakeデータフローの概要データをXLakeストレージに保管する前段階で、分析に必要な事前のデータ処理を行えるサービス。例えば、ログデータを構造化するなど、ユーザーが必要とする形式でXLakeストレージに格納できる。処理量(1Tバイト単位)で契約する。プル型でデータを取りにいくフロー(SFTP/HTTP/JDBC)と、プッシュ型でデータを受け取るフロー(HTTP/MQTT/Apache Kafka)のいずれも利用できる
XLakeアナリシスの概要XLakeストレージに保管したデータを分析する基盤。複数のノードで分散処理できる。データ分析ミドルウエアとして、SQLクエリーを利用できるApache Hiveと、機械学習を利用可能なApache Sparkの利用環境を提供する。いずれも、処理性能に応じた契約となる
価格(税別)非公開
発表日2020年5月7日
提供開始日2020年5月7日