需要急増中!データサイエンティストとは?誕生の背景、仕事内容、スキル、年収などを詳しく解説
膨大な個人や社会のデータが蓄積されていく昨今、この情報をいかに役立てていくのかが課題となっている。そんな中、俄然注目され始めている職業がデータサイエンティストだ。
まだ新しい分野の職業のため、現場は常に人材不足。
マーケティングのみならず、医療や地方創生などと需要は多様化しており、今後の展望も大いに期待できる分野だ。
データサイエンティストとは具体的にどんな職業なのか、そしてデータサイエンティストになるために必要なスキルは何か。
データサイエンティストとして企業に勤め、現在はビジネスマン向けにデータ活用の研修講師をしている米谷学先生に、話を聞いてみよう。
目次
米谷学 先生
1990年代から、商社・国際複合輸送業などの勤務を経て、データマイニングの教育の事務局として活動。
現在は、日経ビジネススクールのオンライン講座などで、企業におけるデータ活用・データ分析に関する講師業務などに携わる。
著書として『ビジネスマンのためのデータ分析&活用術』(フォレスト出版)、『7日間集中講義!Excel統計学入門』(オーム社)などがある。
データサイエンティストとは
※データサイエンティストとは、データサイエンスから課題解決を導き出すプロフェッショナル
データサイエンスとは何か、役割と定義
データサイエンスとは、アルゴリズムや統計、AI、データ分析などの情報科学理論を組み合わせ、ビッグデータから価値を引き出すことをいう。データサイエンスに取り組み、価値を引き出し、課題解決を導き出すプロフェッショナルが、データサイエンティストだ。
企業や医療機関、自治体が保有する大量のデータを分析・解析することにより、これまで勘や経験で行われてきたマーケティングやリスク回避、効率化を、より科学的に理論的に高めることができる。
データを分析し解析することで、例えば「Aの商品を購入する人はBをセットで買う傾向が高い」など消費者による仮想の行動を、確率として導き出すことができる。
ほかにも、医療分野であれば、検査のデータや症状のデータを分析して、医師が病気のリスクを早期に診断するなど効果的な予防・治療が可能だ。
快適なサービスも、安全な暮らしも、データサイエンスのうえに成り立っている。データサイエンティストは、実は身近な職業なのだ。
データサイエンティストの需要
データサイエンティストは分析だけではなく、仮想立案から実装まで手掛けるうえに、その分野の専門性が求められる。課題をもつ分野ごとにデータサイエンティストが必要だといっても過言ではなく、人材は大いに不足しているのが実情だ。
データサイエンティストの仕事は将来AIに取って代わられるのでは、という議論もある。
しかし、データサイエンティストは解析するだけではない。
現場と一体となって、データだけではなく人々の感情や文化などトータルで考えられる力が必要だ。
コミュニケーション能力やマネジメント能力をもち、チームで成果をあげられる人材が、将来的にも重要とされるだろう。
データアナリストとの違い
データアナリストとデータサイエンティストの仕事は、共通する部分も多い。一般的には、データアナリストはデータの「収集」と「分析」までが業務範囲であり、データサイエンティストはその前後も担う。
データサイエンティストはデータ収集の前提として「課題の洗い出し」「目標の明確化」「仮説の立案」を行い、このためにはどんなデータを収集する必要があるのかを決定する。
さらに分析後、マーケティングの方法やモデル化などを行い実装へ導く。
データアナリストの業務が「収集」「分析」に対し、データサイエンティストの業務範囲はそれよりも広い。
課題解決対象の専門性や、場合によってはマーケティングの知識が必要であることも、データアナリストとの違いだ。
データサイエンティストの仕事
※データサイエンティストの仕事にはどのようなものがあるのだろうか
データサイエンティストの仕事の流れ
大量のデータの分析結果を「活用」するのがデータサイエンティストの仕事。従って、プロジェクトの最初からかかわることが多い。
まず、業務担当者にヒアリングを行い、分析活用の目標を決める。
次にデータの担当者にヒアリングを行い、分析するデータを解析し、可視化して、結果がもつ意味の評価を行う。
評価からモデリングを行い、効果を検証。検証の結果、有効であり問題がないことが確認されたら、サービスとして実装する。
実装後も自分の分析結果やモデルが最善のものか、評価と検証を続ける。環境や状況の変化をみながら、さらに効果的なモデルを検討するために、このような作業を反復していくことも多い。
データサイエンティストが使うツール
よく使う道具や機材、情報技術などは、文書作成ソフト(Word、一太郎など)、表計算ソフト(Excel、スプレッドシートなど)、プレゼン資料作成ソフト(PowerPoint、Keynoteなど)、統計用ソフト(SAS、SPSS、STATA、Rなど)など。パソコンでの作業が圧倒的に多い。分析・解析だけではない 発想力が試される仕事
マーケティングならば、天気や季節など人が関与できない変化があっても一定の成果が得られる方法が求められますし、製品開発であれば品質のばらつきを抑えて再現性を高めるモデルが求められます。
これらを遂行するためには、やみくもに大量のデータを分析すればよいわけではありません。どんなに大量のデータがあったところで、データにないことは、やっぱりわからないからです。
従って、データサイエンティストは『どういったデータを集めなければならないのか』から計画を立てる必要があります。そのためには『発想力』が何よりも重要です。
多くの研修生をみて感じるのは、やはり自分が興味をもてる分野で、ありたい未来像を設定できる人は発想力が高いうえに、成果を上げています。ツールや統計学などの知識よりも、業界の専門性や熱意を持っている人が強いですね」(米谷先生)
データサイエンティストになるには
進路は興味ある分野へ 数学科や工学系じゃなくてもOK
業務との親和性が高いこともあり、データサイエンティストとして働いているひとは、大学院などで統計学、数学、情報工学などを専攻していた場合が多いようだ。しかし、企業のマーケティングや医療、地方自治、政策などに携わってから業務に就くこともあるため、環境やバイオなど、その他の理系の出身者や文系出身者もいる。
必ずしもデータマイニングの知識をつけなければならないというわけではないのだが、将来の職業にデータサイエンティストも視野にいれるのであれば、データの収集・分析の素地を身につけていると仕事に生かせるだろう。
また、データサイエンティストの仕事はプロジェクト全体にわたるため、コミュニケーション能力や発想力、マネジメント能力も要求される。
そのためにも、自分の得意分野をさらに深めて専門性を高めることが重要だ。
わからないことがわかる快感と楽しさがやりがいに
できるだけ避けて生きていたのですが、データを読み取り計画を立てないことには、売り上げを上げられないと気づいたことが、データサイエンティストとしての第一歩でした。
私の場合は、『この商品を売りたい』『消費者に届けたい』という思いから、知識や技術の習得に至ったわけですが、研修生をみてても、熱意や探求心をもつ人は習得が早く結果も出しています。
進路の決定では、データマイニングやIT知識の習得だけではなく、自分がどの分野で活躍したいのかを考えることが大切です。
市場においても、食品や服飾、製造、医療、地方自治など、業種の専門性が高いデータサイエンティストが求められています」(米谷先生)
データサイエンティストの年収
人材不足が顕著で好条件が期待できる
新卒で就職する場合、データサイエンティストを必要としているIT企業、製造業、サービス業などが多い。データ分析専業の会社の場合、中小企業が多い。
中途採用では、情報処理技術者、通信技術者、マーケティングリサーチャー、製造業の研究者からなる場合が多い。ポストドクター(博士号取得者)からデータサイエンティストになる人もいる。
厚生労働省による令和3年賃金構造基本統計調査によると、年収は平均で531.9万円。
ビックデータの分析や活用のニーズが高まっており、データサイエンティストの人材不足は顕著であり、好条件を提示する会社が出てきているようだ。
就労形態もさまざま フリーランスも
今後は、フリーランスのデータサイエンティストも増えてくるのではないでしょうか。より専門性の高い人材を求めて外注する企業が増えていくと思います。
ただし、将来フリーランスや自営業、データサイエンティストを集めた会社の経営者を目指すとしても、企業に勤める経験はあったほうが絶対に良いです。
企業に勤めることで、プロジェクトを進める流れやお金の流れ、意思決定の流れ、プレゼンやチームビルディングなどを経験、体感することができます。この経験は、フリーランスや経営者となったときに、大いに役立つはずです」(米谷先生)
データサイエンティストになるために必要なスキルとは?
※データサイエンティストには基礎数学などのデータサイエンススキルの他、様々なスキルが必要になる
課題解決のスペシャリストに
まず必要なのが、基礎数学、データの理解・検証、機械学習技法などのデータサイエンススキル。次に、環境構築、プログラミング、IT セキュリティー、データ加工などのデータエンジニアスキル。
こちらは大学や専門学校などで学ぶ知識もあるが、就職後に実地で習得する場合も多い。
素地を作るためにも興味をもっておくことは重要だ。
さらに、論理的思考、課題の定義、活動マネジメントなどのビジネススキル。
これまで見てきたように、データサイエンティストの業務は多岐にわたり、ヒアリングする対象もさまざまだ。従って、実際の現場でプロジェクトをマネジメントしていく力が求められる。
部活動や委員会活動などでスキルをみがくほか、インターンシップなどでの体験もスキルアップに有効だ。
読解力を高めることは統計学の知識よりも重要
・わかっていることは何か。確実に言えることは何か。
・わからないことは何か。確実には言えないことは何か。
・補うためにはどういう情報が必要なのか。
これらをトータルで考えて成果を上げなければなりません。
物事を属性的にみる力、つまり、プロジェクトをひとつのストーリーとして考えられる『読解力』が重要なスキルとなります。
例えば、YouTubeの動画、芸能やエンターテインメントの演出は、どのような流れで売れているのか、人気があるのか、どうやってリスク回避できているのか――などのヒントとなります。
このヒントを読み取る力が読解力であり、仮想を立てるための発想へとつながります。
数学や統計学、データ連携の処理やプログラミング言語などの知識はあるに越したことはないのですが、それらのスキルだけに頼っていては、就業するうえできつくなってくるでしょう。
読解力を高めるスイッチは、やはり好奇心です。
学生のうちからさまざまな分野に興味をもって取り組み、探求心を発揮できる分野をみつけてほしいと感じます」(米谷先生)
データサイエンティストの歴史
データサイエンティスト誕生の背景
データサイエンスという言葉が一般的になり始めたのは2010年ごろだが、1990年ごろにはすでにデータ分析の専門家が必要とされつつあったという。当時は統計担当者やデータ分析担当者と呼ばれていた。
1990年代、Windowsの誕生によりパソコンを個人で所有できるようになると、インターネットが生活に浸透していき、通信速度の進歩とともに行き交うデータが一気に増加。
さらに、2000年に入るとSNSやネットショップなどインターネットを使用したサービスが生活に根付き、ニーズの多様化により扱うデータは膨大に。
データ量に合わせて分析するツールも進化したが、分析結果から利益や価値を創出するためには、担当者レベルでは手に負えなくなってきた。
そこで必要とされたのが、課題解決に直結する意思決定ができるプロフェッショナル・データサイエンティストというわけだ。ICTの進化とともに生まれた職業である。
データサイエンティスト黎明期は90年代
このころはマーケティングとしての需要が主であり、当時商社に勤めていた私自身も、自分で売り上げを上げるために習得しました。
現在は、マーケティングなど営業分野だけではなく、企業の労務や商品開発、医療分野などさまざまな業種において需要が高まっています。自分の得意な分野や業種の革新に関わることができ、さらに成果を出せる面白さがあるという、やりがいが大きく将来性も高い職種です」(米谷先生)
さまざまな業種でビッグデータの活用の機運が高まっている現在、専門性の高さや広い業務範囲から、今後もますます多くの分野で活躍が期待されている。
ビジネスの現場のみならず、医療や社会福祉分野からの需要も高まっている。
データサイエンティストは、社会がもつ課題を解決に導く、「わからないことがわかる」楽しさとやりがいがある職業なのだ。
参照:厚生労働省 職業情報提供サイト(日本版O-NET)
取材・文/櫻庭由紀子 取材協力・監修/米谷学 構成/寺崎彩乃(本誌) ★関連記事をcheck!
将来やりたいことがわからない…進路で悩んでいる高校生へ!将来やりたいことの見つけ方
ゲームクリエイターとは?『バンドリ! ガールズバンドパーティ!』湯田さんにインタビュー
YouTubeクリエイターになるには? 職業にするには? どんな能力が必要なの?
映画監督・二宮 健さんに聞く! 映画監督になるために必要なものとは