IBMのビッグデータ・プラットフォーム(出典:日本IBM)
IBMのビッグデータ・プラットフォーム(出典:日本IBM)
[画像のクリックで拡大表示]
統合開発環境の「Streams Studio」
統合開発環境の「Streams Studio」
[画像のクリックで拡大表示]
IBM InfoSphere Streamsの通信業界への適用例(出典:日本IBM)
IBM InfoSphere Streamsの通信業界への適用例(出典:日本IBM)
[画像のクリックで拡大表示]

 日本IBMの「IBM InfoSphere Streams」は、複数の情報ソースから時々刻々と到着するデータをリアルタイムに複合分析し、迅速な意思決定を支援するストリームコンピューティング用ソフトである。最新版の「V3.0」では、ドラッグ&ドロップ操作でアプリケーションの設計図を作成できるようになった。

 アプリケーションの開発には、独自言語の「SPL(Streams Processing Language)」を用いる。この言語では「オペレータ」と呼ぶ処理ロジックを組み合わせてプログラムを構成する。基本的なオペレータとしては、フィルタリング(データの間引き)を行うFunctor、複数の入力ストリームを一つの出力ストリームに結合するJoin、一つの入力ストリームを複数の出力ストリームに分散するSplit、指定個数のデータが到着するたびに合計/平均/最大値を求めるAggregate、ファイルやデータベースなどのさまざまな情報ソースからデータを取得するSourceなどがある。

 V3.0ではこれらオペレータが矩形のアイコンとして提供され、統合開発環境の画面上にドラッグ&ドロップ操作で配置して線で結ぶという作法により、アプリケーションを開発できるようになった。

 さらに、V3.0では「アクセラレータ」と呼ぶ5種類の新機能群(オペレータ群)を追加して、アプリケーション開発効率の向上を図った。このうち時系列アクセラレータは、予測分析や回帰、平準化など、時系列データの分析に役立つ20個のオペレータを備えており、株式市場の取引データや為替レートなどのリアルタイム分析に利用できる。また、空間情報アクセラレータは、GPSなどの位置情報から距離や方向を計算するためのオペレータを提供し、地域に応じたマーケティングや効率的な配送ルートの決定などに利用できる。このほか、ソーシャルメディア分析用アクセラレータ、センサーやコンピュータから出力されるデータを取り込んで分析するためのアクセラレータ、通信業向けのアクセラレータを用意している。

 なお、ストリームコンピューティングは、CEP(複合イベント処理)とも呼ばれる。意思決定支援のために、データウエアハウスがいったん蓄積したデータをじっくり分析するのに対し、CEPは直近のデータをリアルタイムに分析するのが特徴。例えば、金融のアルゴリズム取引、クレジットカード不正利用の検出、サイバーテロの検出などの用途を想定している。

IBM InfoSphere Streams V3.0の概要
主な機能複数の情報ソースから時々刻々と到着するデータをリアルタイムに複合分析し、迅速な意思決定を支援するストリームコンピューティング用ソフト
価格(税別)444万円から
発表2012年11月19日
提供開始2012年11月19日