資料の紹介
データを探索し、ビジネスに役立つ知見を見つけることは、企業が競争優位に立つうえで必要不可欠だ。その一方で、日々のビジネスから生み出されるデータは、その量もバリエーションも飛躍的に拡大している。いかにして必要なすべてのデータを取得し、保存し、分析したらいいのか、苦慮している担当者も多いだろう。
データのサイズ、複雑さ、ソースの多様さのどれをとっても、従来型のテクノロジーやアプローチはもはや通用しなくなりつつある。これまで別々の“サイロ”に保存してきたデータのすべてを一つのリポジトリに保存したうえで、各種分析エンジンと、AI(人工知能)を含む多様な方法で分析することが求められている。
本資料では、これまでのデータ管理・分析基盤の課題を挙げ、その解決策として、すべての構造化データおよび非構造化データを一元化して保存できる「データレイク」について説明する。さらに、データソースからデータを抽出・処理し、分析を行うデータストアに保存するまでの「分析パイプライン」の作り方を紹介する。





