近年、データリテラシー向上を目標に掲げたり、社内でデータサイエンティストを育成したりする企業が増えています。このニーズの高まりには、大きく2つの理由があります。

 1つ目はDX(デジタルトランスフォーメーション)の施策として、AI(人工知能)による生産性向上を目指す企業が増えたためです。AIの活用にはデータが必須なため、データを扱える人材とその育成に注目が集まっています。また、データを扱う企業の幅が広がっている背景もあります。これまではデータを扱う企業といえばインターネットやソフトウエア関連など比較的新しい業界が中心でしたが、今ではより物理的な世界との関連性が強い、昔からある業界でもデータを収集できます。センサーからデータを集め、そのデータをAIで分析して簡単にさまざまな事象を認識できる時代になったのです。

 2つ目の理由としては、市場変化の激化が考えられます。いかに変化を早く察知できるかがビジネスで生き残るために重要になっているのです。市場を一変させるような新しい技術、破壊的なビジネスモデルを考案するベンチャー企業、新型コロナウイルスのような疫病などさまざまな、時には思いもよらない要因でビジネス環境は大きく変化します。そのため、これまでの経験だけを基に意思決定することが難しくなっているのです。トップマネジメントだけでなくあらゆる階層で、顧客動向や社内状況をデータで押さえながら意思決定することが不可欠になりつつあります。

 このように、今日では企業全体の意思決定に関わるマネジメント層はもちろん、全ての社員がデータに対する一定の理解やスキルを持っていることが重要です。そこで本記事では、実務の現場でデータ分析に取り組む際のスキルを基本から解説します。今回はそもそもデータ分析とはどんなものか、基本的な概念を押さえましょう。データ分析に欠かせない知識の1つに「データサイエンス」がありますが、この「サイエンス」という言葉にデータ分析の本質を理解するヒントがあります。

データサイエンスの本質は「課題」を解くこと

 サイエンス(科学)はさまざまに定義できる言葉ですが、筆者はこれを自分が抱いた「何で?」「どうして?」という問いに対して、自分なりの答えを見つけていく営みと考えています。この考えを当てはめると、問いに関するさまざまなデータに当たり、そのデータから何らかの答え、ひいては知見や洞察を導き出すのがデータサイエンスです。データサイエンスというと統計学、機械学習、AI、プログラミングなどを思い浮かべる人もいるでしょう。しかし、実際にはこれらはあくまでツールです。データサイエンスの本質ではありません。

 料理に例えて、あなたが「世界一おいしいカルボナーラを作りたい」と考えたとしましょう。この「課題」を解くには「お湯に入れる塩の量は全体の何%か?」「使う加工肉はパンチェッタ(塩漬けの豚バラ肉)でいいのか?」「ソースはフライパンとボールのどちらであえるのか?」などさまざまな問いに自分なりの結論を出す必要があります。試行錯誤の末に問いの答えを得て満足のいくカルボナーラを作るためには、材料を切ったり、焼いたりという調理テクニックも要ります。

 これと同様に、データサイエンスには何らかの解決したい「課題」があります。「課題」を解くために何をすべきかさまざまな問いを立てて検証し、何らかの知見を得るのがデータサイエンスの本質です。先ほどの料理の例でいうとデータは材料、統計学やプログラミングなどのツールは調理テクニックに当たります。ここでのポイントは、作りたいメニュー(解きたい「課題」)がある人は、必ずしも高度な調理テクニックがなくても料理そのものはできるという点です。つまりMicrosoft Excelしか使えなくても、解きたい「課題」があるならデータサイエンスの営みはできます。一方、たとえ高度なプログラミングスキルがあっても、「課題」を持たない人にはデータサイエンスは難しいということです。

この先は日経クロステック Active会員の登録が必要です

日経クロステック Activeは、IT/製造/建設各分野にかかわる企業向け製品・サービスについて、選択や導入を支援する情報サイトです。製品・サービス情報、導入事例などのコンテンツを多数掲載しています。初めてご覧になる際には、会員登録(無料)をお願いいたします。