社会へ技術還元ができる研究者でありたい。
大学教員から民間企業への挑戦

技術・デザイン

「基礎的な研究と実務を結びつける面白い課題に、心置きなく挑戦できる環境になった」
そう話すのは、AI技術の研究開発組織「AI Lab」のリーダーとして研究の社会実装を牽引する山口。StonyBrook大学でPhDを取得後、東北大学で大学教員となり学術研究を続けてきた山口に、大学機関から民間企業へチャレンジした背景、両方の環境を経験したからこそ見えたこと、研究者としてのキャリア形成について聞いてみました。

Profile

  • 山口 光太
    株式会社サイバーエージェントAI事業本部 AI Lab研究員。コンピュータビジョン、機械学習を用いたWebメディアの分析研究に従事。現在はデジタル広告の表現について分析研究を進めている。2014年から2017年まで東北大学大学院情報科学研究科助教。2014年米国ニューヨーク州Stony Brook大学にてコンピュータ科学のPh.D.取得。在学中Google Inc.エンジニアインターン、Johns Hopkins大学にて自然言語処理ワークショップ参加など研究活動に従事。2008年東京大学大学院情報理工学系研究科修士課程修了。

大学から民間企業へ。
あたらしい環境へ挑戦した理由。

――これまでのキャリアを教えてください。

私は2017年入社で、リサーチサイエンティストとしてAIを使ったデジタル広告表現の分析研究をしています。それまでは2014年に米国ニューヨーク州のStony Brook大学でコンピュータ科学のPhDを取得後、2014年から2017年まで東北大学で助教を勤めていました。博士課程の頃からずっとコンピュータビジョン分野を専門に研究をしており、特にWebデータからの質感の学習、服飾と人の自動認識、画像を通したファッションと社会分析、それから画像と自然言語の関係理解に関する論文を過去に発表してきています。前職含め大学院からずっと学術研究を続けてきた形になりますね。

――大学教員から民間組織へ。なぜチャレンジをしようと思ったのでしょうか。

一番の大きな理由は、自身の成長が期待できる環境で仕事をしたいと思ったからです。前職までは長い間大学組織で研究を続けてきたわけですが、それだけにアカデミック領域でできることできないこと、努力して到達できるところがある程度見えてきていました。そのため、これまでとは違う方向性の経験を積んでみたいなと。例えば大規模実務データを扱ったり、自分自身の技術的バックグラウンドを生かした社会実装でインパクトを与えたり。事業とともに成長するという新しい経験を積んでみたいという意欲が湧いてきたのが転職のきっかけでした。

――2017年当時はまだ、AI Lab立ち上げ期ですね。

はい、AI Labに入った当初はまだチームの立ち上げ期でしたので、入社以降は自分自身の研究の他、使えるリソースの中で成果の出せる研究体制を作るという組織マネージメントにも取り組んできました。これまでに経験のなかった業務ではありましたが、自分自身への挑戦と捉え、より成果の出せるチーム作りに取り組んでいます。

――それまでの大学における研究活動と違いは感じましたか?

1つは自身の研究に割ける割合が増えた点、2つ目は研究の目的や予算も大学とは大きく異なる点でしょうか。前者は事務作業や組織運営業務が減ったことが大きく、もちろん現在も人事やマネージメントなど組織関連の業務が入りますが、いわゆるペーパーワークはほとんど電子化され効率が良いため、大きな負担は感じないように思います。

2つ目の予算については、アカデミックな研究であれば自身で自由な研究計画を作成して競争的予算を獲得するのが一般的ですが、企業では基本的に会社事業に沿ったテーマで研究を計画します。これは、研究だけでなく経営やビジネス理解が必要になる反面、ビジネス現場の実務データが利用できるという利点もあります。事業と研究者自身の研究領域がマッチしている必要があることは、サイバーエージェントに限らず民間企業一般の研究職に求められる点ですね。

――なるほど、「ビジネスの現場がもつ課題を、自身の研究テーマでどう解決できるかを考える力」が重要ですね。

そうですね、企業においては事業の成否に伴って取り組むべき課題も変化してくるため、科研費のように年間計画を立てて期限が来たら終了という形ではなく、上手くいったら事業化、そうでなければ見直しという形で進むと考えます。また、研究者にとっては、Publish or perishのようなプレッシャー主導で業務をするわけではないので、心理的に余裕を持って研究に取り組めるとは思います。
 

変化し続ける企業の研究環境。研究者としてどのようなキャリアを形成するかは自分次第。

――先の質問とは逆に、大学での研究活動と変わらないと感じる点はありますか?

研究プロジェクトについては、事業という大枠の中でどうプロジェクトを進めるのかという裁量がある点は全く同じです。学術的に意義のある研究成果が得られたときに成果を論文や学術会議で発表する点も変わりません。

学会組織の運営や、講演者として招待され研究会や大学の授業で講演することもあり、これも大学に所属していた時と変わりません。AI Labとしても学会の企業スポンサーを行い参加しています。

国際カンファレンスや各種学会参加の様子
国際カンファレンスや各種学会参加の様子

――研究者の育成、という面ではどうでしょうか?

若手社員やインターン生を指導することもあるので、教育にも関わっています。2018年からAI Lab主催で博士課程の大学院生を対象とした研究インターンシップを開催しており、2020年も募集を開始しました。デジタル広告事業の技術課題に対し、具体的な研究テーマを決めるところから学生と一緒に決めて研究を進める形をとっています。博士インターン生も一般的な大学院での研究スタイルに近しい形で研究に取り組めているのではないかと思いますし、自身の研究キャリアを前向きに考えたり、研究結果がどういう使われ方をされ社会で役に立っていくのか、現場から理解する良い機会になっているのではと思っています。

――自身の研究者キャリアの形成は、まさに「両方経験しているからこそ」ですね。

そうですね、両方経験して今思うことは、私自身、心理面での余裕を持ちながらも難しい課題に挑戦できている点、以前と同じように学会発表や研究者の交流を続けられている点、業績を積み上げることで適切に評価がなされ自分自身の成長を感じられるようになった点がとても良いように思います。

民間企業ならではの研究組織体制や、部署連携の難しさも存在しますが、逆にその組織を成長させていくためにPhD取得者が大いに活躍できるチャンスがあるという実感もあります。

高度な技術的内容を論文や学会発表という形で的確に人に伝えられる能力を持った人材はますます貴重だと思いますし、企業研究者として基礎的な研究と実務を結びつける面白い課題に心置きなく挑戦できる環境になってきたように思います。昨今はアカデミアと民間企業の間での人材流動もよく聞くようになり、研究職としてキャリア設計する上で不自由は感じません。

研究成果をビジネス課題の解決に繋げる面白さ

――コンピュータビジョン分野が専門ですが、現在取り組んでいる広告クリエイティブ×AIの研究について教えてください。

主にグラフィックスドキュメントのレイアウトの分析、デザイナーの制作編集データの統計解析、動画広告がどれだけの効果を出すか予測する手法などの開発に携わっています。サイバーエージェントがデジタル広告を制作運用していく中、デザイナーが制作した大量のグラフィックスドキュメント、広告として実際に配信された後の実績データが得られるのですが、こうしたデータから機械学習を用いた研究課題に取り組む機会が多いですね。

――広告のデータは、研究者にとっては「特徴的」だとお聞きしました。

デジタル広告のビジネスデータは学術研究で見かけるデータとはかなり異なっていて、一般的な画像認識研究で扱うような自然写真を見かけることはほとんどなく、写真・イラスト・テキストなどが入り混じった編集された画像・映像データを扱うことになります。データの分布も素直ではなく、学術用途でよく見られる画像認識モデルでは歯が立たないような広告表現も出てきます。またデータの規模も大きく、パブリッククラウド上で大規模データ処理基盤を使って分析処理を進めており、こうした分析対象としては難易度の高い実務データを扱うことが、研究として挑戦しがいがある点ではないかと思います。

――研究プロジェクトのテーマはどのように決まっていくのでしょうか?

研究プロジェクトは、事業の中で出てきた課題から具体的な研究として落とし込むことが多いのですが、逆に研究が先で、研究で成果が出たものをすぐにプロダクトでの実装につなげる場面もあります。例えば「広告効果の予測に関する研究」の成果は、当社が2020年5月にリリースした、「極予測AI」と「極予測TD」で使っています。他の研究においても、実際にプロダクトへ導入され、国際学会での論文採択まで繋がっているケースもあります。研究成果を実務における成果につなげやすい点はAI Labの面白いところですね。

社会に還元される技術を。
学術的にも貢献し、事業的にも成功するような研究開発事例を作り出したい。

――プロダクト開発チームと普段から距離が近いのですね。複数の研究プロジェクトを進める上で意識していることはありますか?

プロダクト開発は複数の人で進めるわけですが、その際は「目線が揃っていない前提」で研究開発の話をするようにしています。エンジニアもビジネスサイドも、自分の専門領域の話をする際には前提知識をなるべく必要としないように、かつ正しく物事が伝わるように気を使う必要があります。機械学習が入ったシステムは作っておしまいと言うようなものでは決してないので、継続的にMLOpsという考え方で運用していく体制が必要になりますし、研究・開発から運用にフェーズが移っても一貫して上手く動くようにするのは決して簡単ではありません。

ただ、AI Labはプロダクトの開発チームと連携し、近い関係性で研究開発をしているので、逆にプロダクトで利用される大規模なデータを扱う基盤技術を習得する機会もありますし、新しいビジネス知識が常に入ってくるスピード感も実感できます。新しい事業が生まれるスピードも早く、新卒・中途問わず事業間で人の流動も多い環境ですが、成果を出せばきちんと評価されるので、AI Labの研究開発成果をどんどん事業に還元していきたいですね。

――最後に、今後のキャリアや挑戦してみたい事をぜひ教えてください

短期的には広告表現の制作に関する実務的課題を解決する方策に取り組みたいですね。もともと研究でもWebからデータを集めてきて研究をするスタイルが多かったのですが、やはり学術研究と実務の違いというのも大きいので、学術的にも貢献があるような技術で、かつ事業的にも成功するような研究開発事例を作り出す経験を積んでみたいという想いがあります。どんな広告表現がどのような効果を生み出すのか、どうやったら効果的な表現を自動的に作り出せるのか、という問いにきちんと答えられる技術はまだまだ世の中にほとんどありませんし、だからこそ研究として取り組むべきだと思っています。

長期ではAI Labで開発した技術を何らかの形で社会に還元させていきたいと思っています。論文というのも一つのフォーマットですが、社会実装にはいくつものやり方がありますから。

この記事をシェア

オフィシャルブログを見る

記事ランキング

サイバーエージェントのプロダクトリリースを支える「PipeCD」が、世界に通じるOSSになるまで。

技術・デザイン

サイバーエージェントが開発したOSS「PipeCD」は、KubernetesやGoogle Cloud Run、Amazon ECS、AWS Lambdaといった様々なプラットフォームで統一的なGitOpsスタイルのプログレッシブデリバリーを実現します。本プロダクトは、開発生産性を向上させるための専門組織「Developer Productivity室」によって開発・運用されており、社内では3,500以上のアプリケーションに利用されています。現在、社内外の多くのコントリビューターによる開発参加が進み、スター数の増加と共に成長を続けています。
2023年5月には、「PipeCD」がCloud Native Computing Foundation(CNCF)のSandboxプロジェクトに選定されました。Sandboxプロジェクトの選定基準には、成熟度・将来性・信頼性などがあり、全世界から96プロジェクトが選ばれています。日本発のプロジェクトが選ばれることは稀であり、継続的デリバリーシステムに特化した製品としては国内初の採択例です。
「PipeCD」の開発責任者であるTran Cong Khanhに、サイバーエージェントにおける導入事例や、開発エピソードを語ってもらいました。

Page Top