こんにちは、エイクエントでマーケティングを担当している宮崎です。

先日開催された「アナリティクスサミット2019|データ分析のその一歩先へ」に参加してきました。イベントレポートは公式ページにゆずるとして、マーケティング領域に特化する人材エージェンシーのマーケ担当として、所感を以下にご報告します。

僕の頭に浮かんだ疑問は…

データサイエンティストが不足するってホントかな?

ということです。

近年、ビッグデータ分析の重要性が認識され、分析にはデータサイエンティストが必要だが、人材が足りない!という声を聞くことが増えています。でも、本当にそうなのかな?というのが僕の感想なのです。

以下、そう思った背景と、この問いに対する僕の答えです。

人間だと2年、機械学習だと2時間

サミットの基調講演は、株式会社ワークマンの土屋哲雄氏のプレゼンでした。ワークマンは、作業服専門の小売店を経営し成功をおさめている会社です。

土屋氏は、プレゼンの中でこんなことを話してくれました。

  • ワークマンは、データドリブン経営を徹底している
  • 一般社員向けにエクセル講座を開催している
    内容まで詳しくわかりませんでしたが、講座のタイトルをみる限り「vlookup程度」のレベルではなさそうでした
  • データ分析力がない人は、管理職に登用しない
  • 社員270人中、アルゴリズムの開発が出来る者が10人ほど
  • などなど

…とこれだけ聞くと「データ分析が得意な人材がますます必要になる」という結論になります。

けれども、僕が気になったのは、土屋氏が漏らした次のフレーズです。

社員が2年間かけて作ったアルゴリズムと、DataRobotが2時間で作ったアルゴリズムが、大体同じ成果を出した

 このフレーズの含意を理解するにはDataRobotについて知る必要があるので、説明します。

誰でも使える機械学習

DataRobotとは、機械学習を一般のビジネスパーソンでも活用できるようにした、分析ソリューションです。開発元のDataRobot社には、統計学の天下一武道会と言われる「Kaggle」で優勝したデータサイエンティストも所属しています。つまり、世界一流の分析手法を、誰でも使えるようにしたのがDataRobotなのです。

僕は、DataRobot社のデモを見たことがあります。こんな感じでした。

  1. あるB2B企業が過去に獲得したリードデータをDataRobotに入力する
    データ内には、リードの事業詳細や、成約に至ったか否かの情報が含まれています
  2. DataRobotはそのデータを自動分析して「予測モデル」を作り出す
  3. そのB2B企業が、新たに獲得したリード情報を予測モデルに入力する
  4. 予測モデルが成約確率がリードをはじきだす
  5. 結果「このリードは成約確率が高いのでじっくり商談を進めよう」という意思決定が可能になる

* * *

従来、予測モデルを構築するには、専門教育を受けたデータサイエンティストを雇い、アルゴリズムを微調整しながら精度を上げていく必要がありました。しかし、現在の労働市場でデータサイエンティストを雇用することは難しく、各企業内では、データ分析を「したくても、できない」場面が多く発生しているはずです。だからこそ「データサイエンティストが不足する!」と各所で喧伝されているのでしょう。

DataRobotは、機械学習を自動化することで、そんな課題を解決するソリューションなのです。

データサイエンティストは不足しない

ワークマンのプレゼンに話を戻しましょう。

「人間が2年間試行錯誤をして作ったモノと、DataRobotが2時間で作ったモノが、大体同じ成果を出す」ということの含意は「データサイエンティストは要らない」ということです。「要らない」というのが言い過ぎなら、予想よりは少ない人数で済むと言いましょう。つまり「不足しない」わけです。

僕のこの意見は、アナリティクスサミットでの、別の登壇者のプレゼンを聞いてより強固なものになりました。それはプリンシプル社小田氏のプレゼンです。

機械学習による自動最適化が進むGoogle広告

かつての広告運用は、人間が運用実績データを分析し、各種パラメーターを調整するもので、担当者のスキルの巧拙により、成果に差が出てるものでした。つまり人間の仕事に高い価値があったわけです。

しかし技術が進歩し、話は変わります。

現在のGoogle広告では、多くのパラメーターは機械学習により自動調整され、成果が上がっているそうです。Googleの機械学習は、人間が処理出来ない量の情報を、分析することが出来るからです(補足すると、機械学習による自動化が機能するには、Webサイト構成をGoogleが推奨する形式にし、かつ、十分な量のトラフィックがあることが条件です)。

つまりここでも分析は人間の仕事ではなくなってしまったのです。

株価に最適化されるGoogle広告

冒頭の問いに戻ります。データサイエンティストは不足するのでしょうか?

データサイエンティストの仕事を「予測モデルを作ることのみ」とするなら、上に書いたように、データサイエンティストは不足しないと僕は予想します。予測モデルは機械学習システムのほうが早く作ることが出来るからです。

けれども、データサイエンティストの役割をもっと広く定義すると、話は変わります。

小田氏のプレゼン中には、こんな話がありました。
プリンシプル社では、これまで広告運用に使っていなかった類のデータを、Google広告の機械学習サイクルに反映させようとしているそうです。

例として触れられていたのは「株価情報」です。プリンシプル社はオンライン証券事業者と協働で、以下の仮説のもと「株価連動の入札調整」を実験しているそうです。

  1. オンライン証券の口座開設数は、日経平均株価に影響されるようだ
  2. 株価が上がれば「この波に乗って俺も一儲けするぞ」という者が増え、下がれば逆となるだろう
  3. ということは、株価が上昇基調にある時は、Google広告での入札金額をあげて、自社の露出を増やす戦略が効果を生むはず
  4. では株価情報を自動的に取得し、それをGoogle広告に反映させる仕組みをつくってみよう
  5. あとは、Google広告で機械学習が働き、自動的に広告調整が行われるはずだ

このシステムは未だ実験中であり、プレゼン中では明確な成果は語られませんでしたが、興味深い取り組みであることは事実です。

データサイエンティストの仕事

さて、今後データ分析における人間の役割はどんなことになるのでしょうか?それは…

意味のあるデータを取得し、機械学習システムへ入力する仕組みを作ること

でしょう。今のところ、どんなデータが意味を持つのか目星をつけたり、それを自動的に取得する仕組みを作ることは人間にしか出来ません。

機械学習システムは、株価情報を与えさえすれば効率的な広告運用をしてくれますが、そもそも「株価情報を取ってこよう」という意欲を機械学習システム自体が持つことはないのです。

データサイエンティストが活躍するのは、分析そのものではなく、DataRobotやGoogle広告(のような機械学習システム)が効果的に可動するように、その環境を整えることになるはずです。

今年のサミットのサブタイトルは「データ分析のその一歩先へ」でした。データ分析の一歩先は「データの取得」です。データを取得したりその環境を構築す人は、もはやデータサイエンティストとは呼ばれないかもしれませんが、重要な役割であることに間違いはありません。