アマゾンウェブサービスジャパンの「Amazon Redshift」は、クラウドサービスとして利用できるDWH(データウエアハウス)である。カラム指向のSQLデータベースであり、MPP(超並列処理)型のアーキテクチャで動作している。AWS(Amazon Web Services)上の1つのサービスとして提供する。

Amazon Redshiftの概要
Amazon Redshiftの概要
(出所:アマゾンウェブサービスジャパン)
[画像のクリックで拡大表示]

特徴

 大容量データを高速に分析する用途に向いたクラウド型のDWH。AWSのコンソールから数回クリックするだけで新しいDWHをデプロイきる。バックアップやレプリケーションなどほとんどの管理タスクを自動化している。

仕組み

 SQLで問い合わせるRDBMS(データベース管理システム)である。カラム型のデータベースである。MPP(超並列処理)型のアーキテクチャで動作する。

 Amazon Redshift内のデータは、自動的にAmazon S3にバックアップする。災害対策のために、別のリージョンにあるAmazon S3に非同期でスナップショットを複製できる。AWSの管理コンソールやRedshift APIを介して、スナップショットからクラスターを復元できる。メタデータを復元した段階でクラスターを利用できるようになる。データをバックグラウンドでスプールしている最中にもクエリーを実行できる。

 クラスターの信頼性を向上させる各種機能を用意している。クラスターの状態を常時モニタリングして、障害があるドライブから自動的にデータを再度レプリケートし、必要に応じてノードを交換する。クラスターをデータの損失やアプリケーションの変更なしに、代替のアベイラビリティーゾーン(AZ)に再配置できる。

 Amazon Redshift SUPERデータ型を使うと、JSONなどの半構造化データをRedshiftテーブルに保存し、PartiQLクエリー言語で問い合わせられる。PartiQLはSQLの拡張機能であり、オブジェクトと配列のナビゲーション、配列のネスト解除、動的型付け、スキーマレスセマンティクスなどのクエリー機能を提供する。従来の構造化SQLデータと半構造化SUPERデータを組み合わせて分析できる。

スペック

 サーバーのエントリー構成「dc2.large」のスペック

  • vCPU:2
  • メモリー:15Giバイト
  • ストレージ容量:SSD 0.16Tバイト
  • I/O性能:0.60Gバイト/秒

 ストレージのエントリー構成「ds2.xlarge」のスペック

  • vCPU:4
  • メモリー:31Giバイト
  • ストレージ容量:HDD 2Tバイト
  • I/O性能:0.40Gバイト/秒

稼働環境

パブリッククラウドサービスであるAWS(Amazon Web Services)

価格・料金(税別)

  • 東京リージョンにおけるサーバーのエントリー構成「dc2.large」は、1時間あたり0.314米ドル
  • 東京リージョンにおけるストレージのエントリー構成「ds2.xlarge」は、1時間あたり1.19米ドル