資料の紹介
正確で迅速な意思決定は、ビジネスの成長に欠かせない。そのためには、手に入る膨大なデータをフル活用して、精度の高い知見を得ることが何よりも重要になる。その手段として近年注目されているのが「データレイク」だ。構造/非構造を問わずあらゆる形式のデータをそのまま保存しておき、必要になったらいつでも分析できるようにする。
データレイクにはこれまで、構築コストや運用管理負荷という課題があった。しかし、Amazon S3をはじめとするクラウドストレージが広く普及したことにより、構築・運用のハードルは急速に下がっている。データレイクの導入を躊躇(ちゅうちょ)していた企業にとって、今はチャンスと言えるかもしれない。
本資料では、データレイクの基本概念と、ETL(Extract/Transform/Load)ツールを活用して分析前の処理を効率化する実装方法について解説する。さらに、ある製造業ユーザーがAmazon S3とETLツールを使ってデータレイクを構築した取り組みと、そこで採用された、Amazon S3との親和性が高いETLツールについても紹介する。





