「そのデータサイエンスは、本当にビジネス貢献できていますか? 」
ー『効果検証入門』著者が語るデータサイエンスのあり方ー

技術・デザイン

「ビジネスに貢献出来ないデータサイエンス」の需要はいつか無くなる。
そう話すのは、AI技術の研究開発組織「AI Lab」の経済学チームでリサーチサイエンティストとして活躍し、今年1月に出版した著書「効果検証入門」が反響を呼んでいる安井。
経済学を用いてデータサイエンスの理想の形を追求、共同研究でも数々の実績を残している安井に、データサイエンスをよりビジネスに活かすための方法を聞いてみました。

Profile

  • 安井翔太 サイバーエージェント AI Lab Economic Research Scientist
    2013年Norwegian School of Economics MSc in Economics 修了後、サイバーエージェント入社。 入社後は広告代理事業にて広告効果検証等を行い、2015年にアドテクスタジオ(現AI事業本部)へ異動。以降はDMP・DSP・SSPと各種のアドテク商品においてデータを元にした意思決定のコンサルティング等を担当。 現在はAI LabのEconグループのリーダを担当。

事業に貢献するには。自分なりの「データサイエンスの正解」

──ノルウェーで経済学を学んだ後、どうような経緯で新卒でサイバーエージェントに入社したのですか?

学生の時は環境・資源経済学における実証に興味がありノルウェーの大学院で「養殖サーモンの価格に周期性が存在するのか?」というテーマに取り組んでいました。
就職活動では業務の中でデータを扱う事が出来る会社を探していたのですが、2013年当時、企業の中でどうデータ分析に携わるのが正解なのかは誰もよく分かっていませんでした。そういった不確実性の高い未来がある場合は、自分で判断し挑戦できる環境にいることが重要だと思いました。そのため会社がどの程度の裁量や自由度を与えてくれるかに重点を置いて様々な会社を見ていたのですが、僕の知る限りではサイバーエージェントが当時ダントツに自由度が高いと感じ、志望しました。
また、「ビジネスに貢献出来ないデータサイエンス」の需要はいつか無くなると思っていたので、ビジネス貢献のイメージを具体的にするためにエンジニアコースではなくビジネス職として入社しました。

──ビジネス職で入社し、そこからどのように現在のAI Labの研究職に辿り着いたのですか?

入社してから2年ほどは、インターネット広告事業本部のディスプレイ戦略局で、基礎的な統計と集計でマーケティングデータを扱うコンサルのようなことをしていたのですが、ある日、役員の内藤から「機械学習をやってほしい」という話をもらい、2015年にアドテクスタジオ (現AI事業本部)に異動しました。

──突然のミッション変更だったのですね!

入社してからはR言語くらいしか使っていなかったので、今考えたら相当なチャレンジだったと思います。 2013年に立ち上がったアドテクスタジオでは、既にデータサイエンティストが複数名いました。機械学習のバックグラウンドとエンジニアリング技術も持っているような方々だったので、自分が出る幕はほぼありませんでした。機械学習という新しい分野に触れる楽しみもありましたが、自分がその場では何の価値もないかもしれないという不安と焦りは今でも覚えています。そこから、より「エンジニアとしての技術が無い自分が、どうやってプロダクトに貢献するのか」を考えるようになったと思います。その結果として「機械学習とビジネスの関連」、つまり機械学習が事業の売上などのKPIに対して持つ因果効果や、機械学習の予測値を使った意思決定方法に興味を持つようになりました。

──そして2016年AI Labの立上げと、経済学チームの発足に繋がるのですね。

2016年に初期メンバーの一人としてAI Labを立ち上げました。開発チームと喧嘩したりと、当時は大変なこともありましたが(笑)、協力して研究開発の体制を模索してきました。2017年には、これまでの取組みを「経済学と機械学習の融合」として捉えてR&Dとして認めてもらい、AI Lab経済学チームを結成することができました。今振り返ってみれば、自分がこれだと思う研究テーマに自由に挑戦させてもらう中で、自分なりのデータサイエンスの正解を見つけられたので良かったと思います。

因果推論で評価する、事業に対するデータサイエンスの貢献度

──データサイエンスの正解とはどのようなイメージですか?

シンプルに、データサイエンスプロジェクトが何によって評価されるのかを明確にし、その評価が改善されるタスクの設計や手法の選定を行うといったものです。データサイエンスが「ビジネスやサービスの質に貢献する」ことをゴールにするのであれば、その貢献度合いが当然評価の対象になるべきです。

──では、データサイエンスの貢献度合いはどのように評価するのでしょうか。

この貢献度合い評価に関しては、ABテストや因果推論が大きな役割を果たすと考えています。しかし、このような因果効果による評価が行われるときに、どのような手法を利用すれば良いのかはあまり明らかになっていません。
例えば機械学習モデルの評価が最終的にはABテストで行われるにも関わらず、どのモデルをABテストに掛けるかはそれとほぼ関係性がない精度指標で決められる状況はよく見られます。

──新たな着眼点と実績が認められ、前回のサイバーエージェント全社総会では最優秀ベストエンジニア賞を受賞されていましたね!おめでとうございます。

サイバーエージェント全社総会での受賞の様子
サイバーエージェント全社総会での受賞の様子

ありがとうございます。AI Labの経済学チームでは先ほど説明したデータサイエンスが因果効果で評価されるときに必要となる手法の研究と応用を行っています。既存の機械学習やデータサイエンスの手法の多くは、因果効果による評価が行われる場合を想定していません。よって、これらの手法を因果効果によって事前に評価する方法と、それに基づいてモデルを学習する手法が必要となってくるので、共同研究を行っているイェール大学の成田悠輔先生とは、このテーマの中心的な課題であるモデルの評価に関する研究を行っています。

チームを立ち上げた当初は、社内でも「こいつは何よくわからない事をやってるんだ?」という疑問を持たれることもありましたが、共同研究の取り組みを通してテーマの重要性について理解してもらえる事が増えてきましたし、経済学の重要性を理解してもらえる事はとても嬉しく思っています。

ビジネス貢献につながる産学連携の形を作り上げていきたい

──産学連携を通して、どのような発見があったのでしょうか?

イェール大の成田先生との共同研究は、自分が因果推論と機械学習の組み合わせが重要だと思い始めたタイミング、研究に集中できるAILabの環境、以前のインタビューでも紹介したように「成果の出ないダサい産学連携はやらない」という成田さんの強烈なモチベーションといった条件が上手く重なった研究プロジェクトでした。その結果AAAIで論文が採択されたり、そのほかにもCCSE2019日本経済学会でパネルディスカッションしたりと楽しい産学連携ができていると思います。

──日本とアメリカ、遠隔での共同研究は大変ではなかったですか?

特に不都合はありませんでした。帰国なさった際に打ち合わせもしていましたが、普段もSlackで連携をとっていたので。また、研究組織の成長という観点においては、成田先生と矢田さん(イェール大学の大学院生)の研究の進め方から、色々な学びを勝手に得させてもらいました。ここで得た学びはその後の研究プロジェクトに大きな影響を与えています。

──どのような影響があったのでしょうか。

特に社内メンバーのみで立上げた研究開発プロジェクト、「遅れCVプロジェクト」ではこれを最大限に利用して研究を進め、国際カンファレンスのThe Web Conference 2020 (WWW’ 20)に採択されています。この共同研究で多くのことを学べていなければ、社員で書いた論文が国際会議で採択されるような研究開発の環境は作れなかったと思います。こういった経験を得たことで、国際学会での論文採択を積極的に狙う研究インターンも実施出来るようになりました。研究組織を成長させるという点でも非常に大きな学びがあった産学連携だと思います。

成田先生と一緒に研究を行っている様子
成田先生と一緒に研究を行っている様子

──民間企業とアカデミアの共同研究のあり方を模索し、実践していく、と。

「そもそも共同研究なんてやってて意味があるのか?」「もっと地に足のついた事をやったら?」という産学連携に対するそれっぽい否定的な意見は各所で聞こえてきます。僕としてはむしろ、どうやったらデータサイエンスをビジネスに貢献できる形に仕上げられるのかがよくわかってないのに、その正解を模索せずに古い教科書をありがたがって輪読し続けたり、役に立つかもよくわからないような機械学習モデルを実装して悦に浸ってたり、謎のデータサイエンス組織論を振りかざしている事こそリスクなんじゃないかと思います。

もっとビジネスに貢献できるデータサイエンスをつくり上げるために、今後も色々な産学連携のテーマや形を模索していきたいと思っています。

著書「効果検証入門」に込めた思い

2020年1月、著書「効果検証入門」を出版。

──このような取り組みの中で執筆された「効果検証入門」が非常に話題になっていますね。 

基本的に自分自身がデータ分析に興味を持ち始めた学部生の時に知りたかった内容についてまとめているので、経済学の先生達にも入門書としてお勧めして頂いたのはかなり嬉しかったです。
効果検証入門は、先ほど述べたような「データサイエンスの正解」の一歩めに当たる、評価の部分で使われる因果推論・計量経済学の入門書です。大まかには「どうやって適正な評価を行うのか?」について書いています。データサイエンスプロジェクトの効果の測り方はあまり意識していない人が多いと思います。しかし、「インパクトの最も正しい測り方が何か?シンプルな測り方の何が問題か?」といった基本的な知識が無い状態で、ただ機械学習をビジネスに投入すると、その評価がよくわからず、何の効果も無い事をただ続ける状態にもなりえます。これはデータサイエンティストにしてみれば、長期的には何の経験値も得られない無駄な時間を過ごすことになってしまいます。「効果検証入門」を通じて、自分の分析が何で評価されるかをしっかりと理解した上で、自分の分析を進めるといったデータサイエンスの基本的なスタンスが広まると良いなと思っています。

──AI事業本部ではどのように評価方法が取り入れられていますか?

AI事業本部でのデータサイエンスが面白いのは、データサイエンティストがプロダクトチームに所属してプロダクトに深く入り込むことで、データサイエンティストが事業の意思決定に対して影響を与える事が可能な点にあると思います。そして、AI事業本部ではこの利点を活かしてデータサイエンスの評価を自ら設計する行う事が出来ます。実際にこの利点を評価の設計に活かしてもらうために、新卒向けのデータサイエンス研修では「効果検証入門」に書かれているような内容の基礎的な部分を紹介しています。

──最後に今後のキャリアやチャレンジしたいことを教えてください。

研究で今後目指していることは、因果効果をビジネスにもたらせる機械学習・データサイエンス技術の開発と応用です。この他にも因果推論と機械学習以外にもインセンティブ設計に関する応用にも何か関われたら良いかなと考えており、これについても何か面白い報告をいつか行えたらと思ってます。また、今回適正な評価を行うための入門書を書いたので、その続編に当たるような適正な評価を改善するためのデータサイエンスについても何か書く機会が得られたらと考えています。

また、データサイエンスという観点では、上で挙げたような技術を円滑に利用できるデータサイエンス組織の形成にとても興味があります。因果効果を代表とする経済学の考え方を導入するためには、中途半端にデータ主導な意思決定が染み込んだ組織の文化を破壊して変えていく必要があります。AI事業本部内に設立した、データサイエンティストの横断組織であるデータサイエンスセンターでの活動を通して、そういったスクラップ&ビルドに取り組んでいきたいと思います。

2021年度新卒採用エンジニアコース本選考エントリー受付中

2021年度卒エンジニアコースのエントリー受付中です。職種に沿ったインターンシップやイベントの情報をご案内させていただきます。みなさまからのエントリーをお待ちしています。

この記事をシェア

オフィシャルブログを見る

社会へ技術還元ができる研究者でありたい。
大学教員から民間企業への挑戦

技術・デザイン

「基礎的な研究と実務を結びつける面白い課題に、心置きなく挑戦できる環境になった」
そう話すのは、AI技術の研究開発組織「AI Lab」のリーダーとして研究の社会実装を牽引する山口。StonyBrook大学でPhDを取得後、東北大学で大学教員となり学術研究を続けてきた山口に、大学機関から民間企業へチャレンジした背景、両方の環境を経験したからこそ見えたこと、研究者としてのキャリア形成について聞いてみました。

Page Top