研究と事業の融合がもたらす革新― バンディットアルゴリズムの社会実装を成功に導いた舞台裏

オンライン広告の世界で、新たな技術革新が生まれています。サイバーエージェントとドコモの合弁会社であるPrism Partnerが、機械学習の手法である「バンディットアルゴリズム」を活用し、広告クリエイティブ選択の最適化機能を実装。
この画期的な取り組みが、世界最高峰のWeb分野の国際学会『WSDM 2025』において論文採択という快挙を成し遂げました。研究と事業の融合、そしてそれを可能にした当社の組織体制や文化とは—。本プロジェクトの中心メンバーに話を聞きました。
全ては事業価値のために—。事業価値の追求から生まれた世界基準の研究成果
――世界最高峰の国際学会、「WSDM 2025」での論文の採択おめでとうございます!この研究の概要を教えてください。
桂川(PP):ありがとうございます。今回の研究では、バンディットアルゴリズムの一手法である「Top-Two Thompson Sampling(以下、TTTS)」をオンライン広告のクリエイティブ選択に応用しました。オンライン広告において、例えばCTR(広告のクリック率)の期待値の点で最適なクリエイティブを特定することは広告効果の最大化に不可欠です。従来のA/Bテストに代わる効率的な手法としてTTTSを活用し、ドコモと当社が共同設立したPrism Partnerの提供する「Prism Partner DSP」に実装しています。この実装により、A/Bテストと比較して、最適なクリエイティブのより正確な特定と実験コストの削減を両立することが可能になりました。

AI事業本部所属データサイエンティスト兼機械学習エンジニアとして、ドコモとサイバーエージェントの合弁会社「Prism Partner(文中、PP)」の提供する広告配信プロダクト「Prism Partner DSP」の機能開発に従事。今回のプロジェクトでは、要件定義から実装、効果検証、そして論文執筆まで一貫して担当。
蟻生(AI Lab):TTTSの社会実装は世界的に見ても最先端な例となっています。適用中のCTR(広告のクリック率)が改善していることを評価した上で、実際のサービスにおいて完全に適用されていることを述べた論文や発表は、調べた限りでは見当たりませんでした。※2025年4月14日現在
これらの点が産業応用における面白さとして国際学会で高く評価されたのだと思います。
金子(PP):先日ドイツで行われた学会では、Amazon・Google・Microsoftなど、世界のテクノロジーを牽引する企業と同じ舞台で発表する機会をいただきました。
桂川(PP):私たちの発表に対して予想以上の反響があり、特に産業応用に関する具体的な質問や意見交換が多かったですね。現場での工夫について話し合えたのは貴重な経験でした。


——どのような経緯でこのプロジェクトが始まったのでしょうか?
金子(PP):Prism Partnerの事業責任者から『広告クリエイティブを軸とした機能改善』の相談があったことがきっかけです。ビジネス課題を解決するために様々な手法を検討する中で、『広告クリエイティブを入稿した後、できるだけ早く効果的なクリエイティブを特定する』という方向性に着目しました。
従来のA/Bテストでは時間やコストがかかり、運用も複雑です。そこで、以前から知見のあった「バンディットアルゴリズム」を活用できないかと考えました。
桂川(PP):課題への解決策を検討する段階で、AI Labでバンディットアルゴリズムの研究を担当する蟻生さんと阿部さんに相談し、TTTSという手法の活用が最適と判断しました。プロジェクトが立ち上がった早い段階で研究の最前線にいるAI Labの2人の知見を借りることができたのは、その後の開発スピードと課題解決に活きています。事業課題に対して技術的に解決できるアプローチの幅を広く持てるのは、研究組織が近くにある企業ならではの強みだなと実感しました。
バンディットアルゴリズムが示す、ビジネス応用の可能性
——そもそもバンディットアルゴリズムは、具体的にどのような領域や課題に活用できるのでしょうか?
蟻生(AI Lab):意思決定が関わるようなサービスであれば、ほぼ全てに使いどころがあると考えています。
例えば、広告の場合、ユーザーの反応を見ながら広告クリエイティブを選ぶというのが今回の応用例で、その「選択」にバンディットアルゴリズム※が使われています。他にも、ABEMAでは、視聴履歴に合わせてサムネイルやレイアウトを選ぶという応用が考えられます。逐次的な選択、つまり過去のデータをもとに選択を行うというシーンであれば、適用できると考えています。
阿部(AI Lab):AI事業本部では、AIで広告効果を最大化する「極予測シリーズ」のように、AIを活用した大量のクリエイティブ制作を実現してきました。そこで次の課題となるのが、それらのクリエイティブを「どのように効果的に選択・活用するか」です。この課題解決にバンディットアルゴリズムは大きな可能性を持っています。
私たちが所属するAI Labの強化学習(Reinforcement Learning、通称:RL)チームではバンディットアルゴリズムに関する研究を以前より行っており、論文執筆や社会実装にも多数取り組んできました。
※バンディットアルゴリズムとは?
自らデータを集めながら、最適な意思決定を学習する手法です。オンライン広告では、効果の高いクリエイティブの特定などの応用があります。

AI Lab 強化学習(Reinforcement Learning、通称:RL)チーム所属。リサーチサイエンティストとして、バンディットアルゴリズムや強化学習の研究開発とそれらの広告配信技術への応用等の研究に従事。本プロジェクトにおいて、手法の提案や実装のアドバイス、論文執筆のサポートを行う。
——今回Prism Partner DSPに実装した機能も、A/Bテストではなくバンディットアルゴリズムの応用が適切と判断されたのですね。
金子(PP):A/Bテストは最適な選択肢を見つけるスタンダードな方法ですが時間やコストがかかる難点があります。一方、バンディットアルゴリズムは試行錯誤しながら最適な選択肢を見つける手法であり、効率的な最適化が可能です。
桂川(PP):バンディットアルゴリズムを応用したTTTS※と呼ばれる手法を用いた機能により、運用者が最適なクリエイティブを手動で特定する手間がなくなり、より正確に、実験コストの削減を実現しながら、最適なクリエイティブの特定が可能となりました。すなわちCTRの期待値が最も高いクリエイティブを効率的に特定できるというところで広告効果に寄与しています。この機能は現在、Prism Partner DSPで配信する全てのキャンペーンで適用されています。
蟻生(AI Lab):Prism Partner DSPへの実装の成果が出たと桂川さんから報告を受け、これは国際的な学会で発表できるレベルだと感じました。そこで、4人でどの学会に投稿するかを相談し、最終的に「WSDM 2025」のIndustry Dayへの論文投稿に繋がったのです。
※TTTSとは?(Top-Two Thompson Sampling):強化学習の一手法で、確率的なアプローチを用いて最適な選択肢を効率的に見つけるアルゴリズム。特に、広告配信におけるクリエイティブの最適化など、試行回数を抑えながら効果的な選択を行う場面で活用される。
事業価値を見据えたAI Labと事業部の理想的な連携
――事業部とAI Labの密な連携体制が大きな成果を生む秘訣だったのですね。連携する上で意識したことはありましたか?
阿部(AI Lab):AI Labの立場で意識していたのは「最新の手法を押し付けない」ということです。研究者としては、論文化を目的とすると最新手法を取り入れることも視野に入ってきますが、まずはプロダクトにとって1番成果が出る方法はどれだろう?という目線を持ち並走しています。
蟻生(AI Lab):今回適用したTTTSも、2016年に論文が出ている既存手法なので、研究のスピードで言えば少し古めの手法ではあります。後続のさまざまな研究も出ている一方で、システムの制約など実運用を考えたとき、実装がシンプルであるほうがやりやすいだろうという考えで提案しました。
阿部(AI Lab):僕らの考えとしては、AI Labが常に新しい研究に触れているので知見が溜まっていく。この手法は実務に使えそうだな、あるいは使えなさそうだなという感覚が分かるので、その知識を事業部に還元しているという感じですね。
——事業価値を重視して進めた結果、プロダクトの改善と論文採択という両面で成果が出たのですね。事業部側として、AI Labとの連携で意識されていたことはありますか?
金子(PP):最も重視したのは、企画段階からAI Labに相談することです。早期相談によって大きく2つのメリットがありました。1つは、AI Labが持つ最新の研究知見から、私たちが思いもよらなかった解決策を提案してもらえたこと。もう1つは、「この方法は効果が見込めない」という判断を事前に得られ、無駄な検証を避けられたことです。そのほか、プロダクト状況の積極的な開示を心がけ、定例の会議体を持つなどコミュニケーションを多くとる工夫を行いました。
阿部(AI Lab):AI Labとしても、まず問題設定をちゃんと明らかにしてから相談をする必要がある、思われているかもしれないですけど、むしろ僕らのチームとしては「事業部として、プロダクトとして本来どういうことをやりたいのか」を 一緒に整理をした上で、目的に対しての最適な手法を提案していきたいと思ってます。ですので、「実現できるかは分からないけど、こんなことをやりたい」みたいな段階から声をかけてもらえると嬉しいです。どんな小さな疑問やアイデアでも、まずは気軽にご相談ください。

AI Lab RLチーム リサーチサイエンティスト兼リーダー。マルチエージェント強化学習や不完全情報ゲームに関する研究に従事。本プロジェクトではプロジェクト全体の方向性をまとめるアドバイザーと論文執筆のサポートを担う。
サイバーエージェント流・役割の境界を超えて生み出せるキャリア
――今回のように、研究と事業が連携しながら成果を生み出す環境の魅力はなんでしょうか?まずは事業サイドにいる2人に伺います。
桂川(PP):研究者の方々も事業課題を深く理解し、実務的な制約がある中で一緒に解決策を考えてくれる環境は、非常に心強いです。特に、常に新しい研究に触れることで得られる知見に基づいて、最適な解決策について議論できる点が魅力です。さらに、このように自分たちが取り組んだ、時には学術的にも評価される最適な解決策によって、事業の成長に直接つなげられることに大きなやりがいを感じています。
金子(PP):現場のデータサイエンティストとしては、日々取り組んでいる業務成果やクオリティの証明として 、今回の「WSDM」のIndustry Dayや「The Web Conference」、「KDD」※で論文が採択されるような成果を出すことが、ひとつの大きな目標でした。
サイバーエージェントには世界的な研究成果を出し続けている「AI Lab」があり、彼らと日常的に連携できる環境があるからこそ、今回のように実務の成果を研究としても認められる水準まで高められました。実際に、GoogleやMicrosoftの研究者との議論や座長からの高い評価をいただいたことはとても励みになりましたし、私たちの取り組みが世界基準に達していることを実感できました。
AI Labと一緒に取り組むことで、今後も世界のトップクラスの学会に挑戦できると思っています。同じように技術の探求に情熱を持つ方々と、また新しい成果を目指していきたいですね。
※「The Web Conference」・「KDD」(Knowledge Discovery and Data Mining)…いずれもデータマイニング分野における世界最高峰の国際学会

AI事業本部所属データサイエンティスト兼データサイエンスチームリーダー。2018年の入社後より広告配信プロダクトのデータ分析や機能改善に携わり、現在は「Prism Partner DSP」のプロダクトのデータ戦略を統括。本プロジェクトの発起人であり、実装レビューや論文執筆を担当。
――AI Labの2人が感じる魅力はなんですか?
蟻生(AI Lab):AI Labは、世界的に見ても非常に優れた研究環境だと思います。制度面のサポートも充実しており、研究に集中できるだけでなく、事業部と協力してビジネス応用を進め、大きなインパクトのある成果を出すことが可能です。ビジネス応用事例に関しては、研究発表ができないケースも多くありますが、今回の取り組みを快諾してくださったPrism Partnerにも感謝しています。
過去にはバンディットアルゴリズムの実応用が難しかったケースもありましたが、その経験をバネに再チャレンジさせてくれるというのも、弊社の魅力的な文化だと思います。「事業にインスパイアされた良い研究をするだけでなく、事業に本質的に貢献する機会も欲しい」というモチベーションをお持ちの方には、最適な環境だと思います。
阿部(AI Lab):転職を経験した身として驚いたことは、そもそも会社全体としてAIや機械学習に対しての理解があるところです。そういった文化があるからこそ、AI Labの研究を事業に導入することに対して、事業部側がすごく前向きなのだと思いました。
「業務改善や効率化にAI技術を取り入れたい」と事業部からの相談も多かったりと、研究組織が事業に関わることに対してポジティブな考えがあるのは日本中探してもなかなかないんじゃないかなと思います。

記事ランキング
-
1
「顔採用ですか?」「採用基準を教えてください」など・・ よく聞かれる質問10...
「顔採用ですか?」「採用基準を教えてください」など・・ よく聞かれる質問10選に人事マネージャーがお答えします
「顔採用ですか?」「採用基準を教えてください」など・・ よく...
-
2
「Abema Towers(アベマタワーズ)」へのアクセス・入館方法
「Abema Towers(アベマタワーズ)」へのアクセス・入館方法
「Abema Towers(アベマタワーズ)」へのアクセス・...
-
3
“ポスト創業者時代”の幕開けに、代表 藤田晋が新入社員へ伝えたエール
“ポスト創業者時代”の幕開けに、代表 藤田晋が新入社員へ伝えたエール
“ポスト創業者時代”の幕開けに、代表 藤田晋が新入社員へ伝え...
-
4
サイバーエージェントの“自走する”人材育成 ー挑戦する企業文化ー
サイバーエージェントの“自走する”人材育成 ー挑戦する企業文化ー
サイバーエージェントの“自走する”人材育成 ー挑戦する企業...
ABEMAにおける生成AI活用の現在地──生成AI時代の開発とエンジニアの成長戦略

新しい未来のテレビ「ABEMA」では、サービスの成長とともに開発体制も進化を続けています。近年では、コンテンツ体験の向上や業務効率化を目的に、生成AIを活用した取り組みが開発局内でも進んでいます。
本記事では、プロダクト開発部門で生成AIの導入を推進してきたプリンシパルエンジニアの波戸と、レコメンド機能の開発を担うエンジニアリングマネージャーの菅にインタビューをしました。具体的な導入事例から現場での変化、生成AI時代のエンジニアに求められる学ぶ姿勢まで、「ABEMA」の開発現場における「生成AI活用の現在地」を聞きました。