新Developer Expertsが語る、バンディットアルゴリズムのさらなる可能性

技術・クリエイティブ

当社には、特定の分野に抜きん出た知識とスキルを持ち、第一人者として実績を上げているエンジニアを選出する「Developer Experts制度」があります。AIを武器に、事業インパクトに直結する成果を出すエンジニアの育成をさらに強化すべく、AI Driven Development、AI Ops、AI基盤の3つを新たな注力技術領域として策定いたしました(参照:「2028年までに全社の開発プロセスを自動化する。サイバーエージェントAI活用のこれまでとこれから」)。

この度、AI基盤のバンディットアルゴリズムにおける初のDeveloper  Expertsに選出された「AI Lab」所属の蟻生に、当技術の持つ魅力やさらなる応用の可能性、今後の自身の展望など話を聞きました。

Profile

  • 蟻生開人
    東京大学で航空宇宙工学の学士・修士を取得。その後、KTH Royal Institute of TechnologyでLicentiate of Engineeringを取得し、2021年にResearch Scientistとして当社に入社。幅広いAI技術の研究開発を担う「AI Lab」にて、多腕バンディット問題・コミュニティ検出・確率的最適化、それらの広告配信技術への応用等の研究に従事。2023年にはDoctor of Philosophyを取得。2025年12月、当社のバンディットアルゴリズム領域におけるDeveloper Expertsに選出。

「良い研究は、良い現場課題から生まれる」 理論の追求と社会実装を両立させられる理由

── バンディットアルゴリズムについて詳しく教えてください。

一般的な機械学習の多くは、用意されたデータを基に学習しますが、バンディットアルゴリズムは行動がデータ収集そのものを決める点が特徴です。逐次的に意思決定を行い、選んだ行動の報酬のみを観測しながら、探索(試すこと)と活用(当たりを引き続けること)のバランスを取りつつ最適化する手法群です。

分かりやすい例として、Web広告でのクリエイティブ選択が挙げられます。例えば、広告主がAとBの2種類の画像を持っているとします。どちらがユーザーに響くかは出稿してみないと分かりません。そこで、実際に広告を配信して反応を集めながら、配信比率を少しずつ更新して「効果が高そうな方をより多く配信する」ように自動調整していきます。

ここで重要になるのが、これまでの観測結果を活用して有望なAを多めに配信するのか、あるいは不確実性を減らすためにBも試して学ぶのか、という「活用」と「探索」のバランスです。有望なAに寄せすぎると、Bが実は良かった場合に最適な選択との差(機会損失)が累積しますし、探索が多すぎると、本来得られたはずの成果を取りこぼします。このトレードオフをうまく扱う手法がバンディットアルゴリズムです。

── 学生時代からこの領域を専門にしていたのでしょうか?

大学では航空宇宙工学科に在籍しており、小惑星の相対軌道推定に関する研究を行っていました。より汎用的な推定手法について視野を広げたいと考えてスウェーデンへ留学したのですが、その際に新たな研究対象として出会ったのがバンディットアルゴリズムでした。

バンディットアルゴリズムは理論的にしっかりした枠組みがある一方で、ニュース推薦や広告配信など実世界への応用範囲が広い点に惹かれ、これまで研究を続けてきました。特に海外ではWeb業界での応用事例が豊富で、企業に所属する研究者も多い印象があります。留学中の指導教員からも「研究を続けたいなら企業が良い」とアドバイスを受け、博士課程後期を対象としたテーマ選択型「リサーチインターンシップ」を経て、サイバーエージェントに入社しました。

── サイバーエージェントに入社して約5年、研究者としてどのような点を魅力に感じますか?

最大の魅力は、研究者と事業部のメンバーとの距離が近く、普段から密にコミュニケーションできていることです。良い研究テーマを見つけるには「良い課題」に出会う必要がありますが、そのためには現場のメンバーとの接点が欠かせません。サイバーエージェントには相談のハードルが低く、気軽に声をかけて新たな挑戦ができる雰囲気があると感じています。

もう一つは裁量の大きさです。企業の研究者でありながら、自分のキャリアやビジョンに基づいて研究テーマを設定したり、国際会議への参加や運営といったアカデミックな活動を続けたりすることが推奨されています。理論研究も含めて、10年、20年以上先の未来にもつながりうる幅広い技術への投資がなされていると感じます。もちろん価値を説明する責任は前提ですが、ここまで個人の裁量を尊重しつつ学術活動も後押ししてくれる環境は貴重です。

あくまで私個人の意見ですが、大学での研究は対象を深く掘り下げられる一方で、企業ではコミュニケーションを通じて視野を広げ、ビジネスの現場から生まれる課題にインスパイアされたテーマに取り組めます。多様な事業を展開しているサイバーエージェントだからこそ、応用可能性の広がりを楽しめる環境だと思います。
 

「自身のキャリアの追求と会社への貢献という両軸を大切に」バンディットアルゴリズムの第一人者としての展望

── どのような点が評価され、今回Developer Expertsに選出されたと考えていますか?

大きく3つの点を評価してもらったと認識しています。 1つ目は研究実績です。国際会議での論文採択など、アカデミックな成果を継続的に出せている点です(参照:「AI Lab、機械学習分野のトップカンファレンス「ICML 2025」にて3本の論文採択 」「AI Lab、機械学習分野のトップカンファレンス「NeurIPS 2025」にて7本の論文採択」)。

2つ目は事業貢献です。サイバーエージェントとドコモの合弁会社であるPrism Partnerの広告クリエイティブ選択における最適化機能に実装されるなど、研究成果を事業に落とし込み、実運用の中で価値につなげられている点です(参照:「研究と事業の融合がもたらす革新― バンディットアルゴリズムの社会実装を成功に導いた舞台裏」)。

そして3つ目はコミュニティへの貢献です。いくつかの国際会議でArea Chair(特定分野の査読進行や採否推薦を担う役割)を務めるなど、選出にあたって対外的な活動も評価していただけました。

ただ、これらの実績はもちろん私一人で成し遂げたものではありません。インターン時代からお世話になっているチームリーダーや強化学習チームのメンバー、そしてAI事業本部のプロダクト担当のみなさんと継続的に連携し、伴走していただいた結果だと感じています。

── バンディットアルゴリズム領域における初のDeveloper Expertsとして、今後どのような活動を進めていきたいですか?また、サイバーエージェントが掲げる「2028年までの開発プロセス自動化」において自身の役割をどのように定義されていますか?

バンディットアルゴリズムは、皆さんが持っているスマートフォンでも十分動かせるほど軽量で、たとえば「選択肢AとBのどちらを選ぶか」といった形で問題を定義できるため、比較的イメージしやすい技術です。特にWeb広告のように、数十ミリ秒オーダーで意思決定が求められる領域では、推論コストが重いモデルは運用上の制約が大きいのですが、バンディットはそうした制約下でも実装しやすい選択肢になります。

今後は、軽量で、しかも改善に直結しやすいというこの技術の特性を社内外に広く伝えていきたいと考えています。現在は広告事業での活用が中心ですが、メディア事業でのレコメンドや、ロボットを用いたサービスにおける動作決定など、意思決定が関わるあらゆる領域に応用の余地があります。社内で「こんなことにも使えるかも?」と感じた方がいれば、気軽に声をかけてもらえる存在になりたいですし、適用チャンスがあれば全力でコミットしたいです。

また「2028年までの開発プロセス自動化」という観点では、生成AI等によって大量の選択肢が生成・提示される状況が増えていくと思います。その中で何を選ぶかの重要性がさらに高まり、バンディットアルゴリズムの活用機会もますます広がっていくのではないかと考えています。

── 最後に、今後の展望を聞かせてください。

これまでインターンを含め約5年、サイバーエージェントでバンディットアルゴリズムの研究と実践に取り組んできました。さまざまな事業に深く関わる中で、ビジネスの核となるアルゴリズムとして、非定常性にどう対処するか、あるいはバッチ処理でも安定して動かせる形にどう落とし込むかといった課題が、より明確に見えてきています。

今後はDeveloper Expertsとして、論文執筆や学会活動といった対外的な研究成果を出し続けることはもちろん、そこから得た知見を現場に還元し、事業課題を解決するアルゴリズムをさらに発展させていきたいです。自身のキャリアの追求と会社への貢献という両軸を大切にしながら、技術の可能性を広げていきたいと考えています。

この記事をシェア

新卒採用の公式SNSをフォロー

  • Facebook
  • Twitter

記事ランキング

【対談】ML/DSにおける問題設定術
~ 不確実な業界で生き抜くために ~

技術・クリエイティブ

機械学習やデータサイエンスがビジネスの現場で当たり前になりつつある今、求められているのは、ビジネスの課題を実装に落とし込み、運用し、継続的な価値を生み出す視点となりつつあります。

サイバーエージェントでは、こうした実践的なスキルを持つ次世代のデータサイエンティストを育成すべく、2025年11月、新卒向け特別プログラム「DSOps研修2025」を実施しました。

「技術を社会実装する際の『問題設定』こそが重要である」 この研修のコンセプトに深く賛同いただき、特別講師としてお迎えしたのが、半熟仮想(株) 共同創業者であり、「Forbes JAPAN 30 UNDER 30 2022」にも選出された齋藤優太氏です。

第1部では、半熟仮想(株) 共同創業者であり、Forbes JAPAN「30 UNDER 30」に選出された齋藤優太氏をお招きし、「ML/DSにおける問題設定術」について講演いただきました。 続く第2部では、齋藤氏に加え、当社執行役員兼主席エンジニアの木村、AI Lab リサーチサイエンティストの暮石が登壇。「現場視点×経営視点」でパネルディスカッションを実施しました。

本記事では、白熱した第2部「パネルディスカッション」の模様をダイジェストでお届けします。

Page Top