DX(デジタルトランスフォーメーション)のカギを握るともいえるデータ。そのデータを蓄積・活用するための基盤として「データウエアハウス(DWH)」や「データレイク」といった言葉を見聞きする。いずれも大規模なデータを管理するシステムだが、両者にはどんな違いがあるのか。自社に必要なのはどちらなのだろうか。こんな疑問を解消するのに役立つ記事を集めた。

 まず、データレイクとDWHの違いを整理しておこう。その定義はさまざまあるが、米ガートナーによればデータレイクは「未知のデータをサポートし、未知の質問に対応し、高度な探索や革新を可能にする技術」。一方のDWHは「既知のデータをサポートして、既知の質問に対応し、ビジネスオペレーションに共通の認識を提供する技術」という。

 両者の役割を自社で定義し、効果的に使い分けている企業もある。住友生命保険は2つのクラウド上に、DWHとデータレイクを構築。全社は全社員が業務に使う情報分析システム、後者はデータサイエンティストがビッグデータを分析するためのシステムと位置付ける。

 これとは異なる使い分けを実践しているのが協和キリンだ。同社はクラウド上にDWHを構築し、2種類のBI(ビジネスインテリジェンス)ツールを使い分ける。一般社員用と研究者用だ。

 DWHを構築するためのツールやサービスの選択肢も広がっている。以下に代表的なものを集めた。

 DWH活用のノウハウが読める以下の資料も役に立つだろう。