ITエンジニアに必要な今を知れる情報メディア
【データサイエンティストとは】必要な知識・能力や職業としての未来
skill

【データサイエンティストとは】必要な知識・能力や職業としての未来

データサイエンティストという職業・職種について、名称を聞いた事はあるけれど、何をしているのか詳細は分からない、あるいは、データサイエンティストに興味はあるけれど、どんな知識や能力が必要かわからないという方は多いと思います。

今回はデータサイエンティストに必要な知識・能力や職業としての未来について述べていきます。

目次

1.データサイエンティストとは

2.データサイエンティストに必要な知識・能力

2.1.統計学

2.2.コンピュータ科学

2.3.人工知能

2.4.デザイン力

2.5.コミュニケーション能力、プレゼン能力

2.6.データ収集・整理能力

3.AIによりデータサイエンティストは消える職業?

4.誰もがデータ分析をする時代がやってくる

5.まとめ

1.データサイエンティストとは

データサイエンティストとは、データを解析して、何らかの知見を得て、それを企業活動や組織活動の役に立てる職業のことです。例えば、営業部で「最近、Aという商品の売り上げが落ちている」という課題があった場合、顧客のデータを分析して、「リピーターが再度買う割合が落ちています」などという知見を伝える仕事です。営業部ではその知見にもとづいた施策が実行できるようになります。

企業活動の中でのデータ解析の専門家ですから、「個人的にそう思う」「そうじゃないか」という知見ではなく、データ解析に基づいた根拠のある知見を提出し、また、データサイエンスの専門家ではない社員にわかるように説明をしなければなりません。

そのためには、統計の知識だけでなく、機械学習、ディープラーニングといった人工知能テクノロジー、さらには分析結果をわかりやすく可視化するデータビジュアライゼーションなど、幅広い知識とスキルが必要になります。

数学の一分野である統計学が知識の中心になりますが、コンピュータ科学、人工知能、デザインなどさまざまな領域に跨った知識が必要になります。そのため、どの企業でも優秀なデータサイエンティストが不足しているのが現状です。

【関連記事】「マイナビエンジニアインタビュー(4)--データサイエンティストと事業の現場をつなぎたい--柴崎友里氏」


【データサイエンティストとは】必要な知識・能力や職業としての未来"

2.データサイエンティストに必要な知識・能力

データサイエンティストは統計学を中心にさまざまな知識も持ち、それらを組み合わせてデータ解析を行わなければなりません。また、サイエンティストといっても、解析をするだけでなく、それを専門知識のない他の部門の人にわかりやすく伝え、納得してもらうコミュニケーション力も必要になります。


【データサイエンティストとは】必要な知識・能力や職業としての未来"

データサイエンティストに必要な知識は、主に次のような6つの分野にわたります。

2.1.統計学

高校で学習するような基本統計量や推定、検定といった知識はあくまでも基本です。データサイエンスで多用されるのは回帰分析で、これにより数値予測を行ったり、分類したりすることが基本になります。

また、予測精度の高い回帰モデルを作ることも要求され、そのためには多変量解析などの高度な統計学の知識が必要になります。また、予測精度を高めるには、回帰理論を理解し、適切な変換、パラメーターの設定が必要となるため、確率分布、微分、線形代数といった数学知識も、モデル構築のツールとして使えるようになっておく必要があります。

2.2.コンピュータ科学

データサイエンティストが扱うデータは、ほぼ例外なくビッグデータであるため、エクセルを使ってデータ解析を行うデータサイエンティストはまれです。多くの場合、統計分析言語「R」や、データサイエンス関係のライブラリが充実しているPython(パイソン)を使います。

統計理論を理解していれば、コーディングそのものは難しくはありませんが、慣れておく必要があります。

【関連記事】「エンジニアも非エンジニアもPythonを学ぶべき理由とは!?--エンジニアに求められる役割に変化も」

2.3.人工知能

回帰分析は、もはや機械学習で精度を高めていく手法が一般的です。そのため、さまざまな機械学習の手法について精通している必要があります。ただ使えるだけでなく、改良をして、より精度の高い分析が行えるようになる能力が必要とされます。また、ディープラーニングを使って、予測、分類を行うことも広く行われるようになっているため、ディープラーニングの知識も必要です。日々、進歩をしている分野なので、英語論文を読み解く力も要求されます。

【関連記事】「機械学習とディープラーニングを学べるオンライン講座4選【無料&日本語】」


【データサイエンティストとは】必要な知識・能力や職業としての未来"

2.4.デザイン力

データサイエンティストの仕事は、解析をして終わりではありません。データ解析から得られた専門的な知見を普通の人にわかる言葉、表現で説明する必要があります。そこで注目されているのがデータビジュアライゼーションです。データを可視化するのに、棒グラフや折れ線グラフといった基本ツールだけではなく、直感的に理解できる可視化が必要になります。これにはデザインセンスも問われます。

2.5.コミュニケーション能力、プレゼン能力

どんなに素晴らしい知見も、他の部門の人に伝わらなければ、知見がないのと同じです。データサイエンティストの仕事は、データ解析をし、知見を得て、それを他の部門の人に活用してもらうところまでが責任範囲です。そのためには、わかりやすく説明できるコミュニケーション能力、説得力のある説明ができるプレゼンテーション能力も必要になります。

2.6.データ収集・整理能力

将来は不要になるかもしれませんが、現在は必要となる必須能力です。企業の中にはビッグデータと呼ばれるほど膨大なデータが眠っていますが、その多くは構造化されていません。フォーマットはばらばらで、各部署に分散をして眠っています。しかも、データは自動収集されるものが多く、担当部署の人間であっても、どのようなデータが蓄積されているかよく知らなかったりします。

これを各部署にヒヤリングを行い、分散しているデータを統合し、しかもデータクレンジングと呼ばれる処理を行わなければなりません。人名の斉藤さんと齊藤さんが同一人物である場合は統合したり、単位の異なるデータを変換して揃えたり、欠損しているデータを埋めたりするなどの作業です。

また、昨今、個人情報保護の法的規制も強くなっていることから、外部機関と共有する場合は匿名化処理もしなければなりません。

このような作業は大部分が手作業となり、データサイエンティストの貴重な業務時間を奪っています。将来は、データ収集システムが構築され、データ整理も自動化されていきますが、それまでは、このデータ収集・整理能力もデータサイエンティストの重要な能力のひとつになっています。


【データサイエンティストとは】必要な知識・能力や職業としての未来"

3.AIによりデータサイエンティストは消える職業?

データサイエンティストは最先端の職業のひとつですが、AIの進化により消える職業のひとつであるとも言われています。これは本当でしょうか。

データサイエンティストという職業が消えるという論拠になっているのは、AIが進化をしてデータ分析は人工知能がやることになるので、データサイエンティストは不要になるというものです。

しかし、この考え方には大きな落とし穴があります。人工知能は、過去の実例を学習し、現在を高い精度で予測することはできますが、未来を予測することはできません。あくまでも、「未来も現在と同じような変化を続ける」という条件付きでしか未来を予測できないのです。未来を予測し、現在の施策を変えていく決断は人間にしかできないのです。

単純なデータ分析は人工知能や機械化により自動化されていきますが、高度なデータ分析、解析、解釈の分野ではデータサイエンティストが必要とされ続けます。ただし、大量のデータサイエンティストを雇うということはなくなり、少数精鋭のデータサイエンティストチームが企業内でチームとして、あるいは現場チームに加わって働くというイメージになります。

4.誰もがデータ分析をする時代がやってくる

現在は、どこの企業でもデータサイエンティストが不足をしており、職業としては有利な条件がそろっていますが、今後は、少数精鋭になっていくことは考慮に入れるべきです。

人工知能の機械学習やディープラーニングは環境が整ってきて、ライブラリを使うとわずかなコードを書くだけで誰でも使えるようになっています。さらにはノーコードとなり、ブロックを組み合わせるようにして人工知能の学習モデルが組み立てられるプラットフォームも登場しています。

近い将来のデータ分析は、Excelのような表計算ソフトに組み込まれ、各部門の社員が日報をスプレッドシートに記入するだけで、裏でデータ解析が行われ、解釈が提示されるということになっていくでしょう。誰もがデータ解析を行う時代がすぐそこまできています。

その時、データサイエンティストの仕事は、社内でのデータテクノロジーの専門家としての業務になります。社員に対して、データ解析の方法やその解釈の理解の仕方を教え、その企業にとって貢献できるデータ解析システムの構築をすることになります。データサイエンティストというよりは、データエンジニアやデータアーキテクトといった方が適切な職種になっていきます。

5.まとめ

データサイエンティストは、企業や組織が生み出すデータを解析して、それを解釈し、所属する企業や組織に新たな知見を提携する職業です。統計学だけでなく、コンピュータ科学、人工知能、デザイン、コミュニケーション力など、複数の領域にまたがった幅広く、深い知識が必要とされます。

AIの進化により、データサイエンティストの初歩的な業務は代替されていきますが、解釈をするという高度な業務は残っていきます。データ分析は、データサイエンティストだけではなく、すべての社員が行うようになり、その時、データサイエンティストは専門家として社員の指導を行い、データ解析、収集のシステム構築を担うようになります。サイエンティストというよりは、エンジニアやアーキテクトと呼ぶのが相応しい業種になっていきます。

原稿:牧野武文(まきの・たけふみ)

テクノロジーと生活の関係を考えるITジャーナリスト。著書に「Macの知恵の実」「ゼロからわかるインドの数学」「Googleの正体」「論語なう」「街角スローガンから見た中国人民の常識」「レトロハッカーズ」「横井軍平伝」など。

この記事はどうでしたか?

おすすめの記事

エンジニア向け求人特集

BACK TO TOP ∧

FOLLOW