
プレスリリース
AI Lab、人工知能分野のトップカンファレンス「AAAI 2026」にて論文採択
―CAゼミ制度によるマルチモーダル大規模言語モデルに関する論文も採択―
株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役社長:山内隆裕、東証プライム市場:証券コード4751)は、人工知能技術の研究開発組織「AI Lab」に所属する研究員のJiafeng Maoならびに、連結子会社の株式会社AI Shift(本社:東京都渋谷区、代表取締役社長:米山結人)の村田栄樹らによる2本の論文が、人工知能分野の国際会議「AAAI 2026」※1の本会議に採択されたことをお知らせいたします。
「AAAI」は、世界中の様々な人工知能分野の研究者が一堂に集い毎年開催される国際会議で、「NeurIPS」「ICML」「KDD」※2などと並んで、人工知能分野で権威ある国際会議の1つです。「AAAI」には2019年より毎年「AI Lab」の研究員による論文が本会議およびワークショップにて採択されており、今回で8年連続※3 の採択となります。
このたび採択された論文は、2026年1月20日から27日にかけてシンガポールで開催される「AAAI 2026」にて発表されます。
なお、村田らの論文は、早稲田大学 理工学術院の河原大輔教授および河原研究室との共著論文となります。
また、当社からは AAAIの公式併設ワークショップである「Artificial Intelligence with Biased or Scarce Data(AIBSD)」※4においても、AI事業本部の佐藤郁子らによる論文が採択されました。
「AAAI」は、世界中の様々な人工知能分野の研究者が一堂に集い毎年開催される国際会議で、「NeurIPS」「ICML」「KDD」※2などと並んで、人工知能分野で権威ある国際会議の1つです。「AAAI」には2019年より毎年「AI Lab」の研究員による論文が本会議およびワークショップにて採択されており、今回で8年連続※3 の採択となります。
このたび採択された論文は、2026年1月20日から27日にかけてシンガポールで開催される「AAAI 2026」にて発表されます。
なお、村田らの論文は、早稲田大学 理工学術院の河原大輔教授および河原研究室との共著論文となります。
また、当社からは AAAIの公式併設ワークショップである「Artificial Intelligence with Biased or Scarce Data(AIBSD)」※4においても、AI事業本部の佐藤郁子らによる論文が採択されました。
■採択された論文について
「AI Lab」ではマーケティング全般に関わる幅広いAI技術を研究・開発しており、大学・学術機関との産学連携を強化しながら様々な技術課題に取り組んでいます。
なかでもクリエイティブ領域における研究チームでは、当社が提供する「極予測シリーズ」をはじめとしたクリエイティブ表現全般に関わるグラフィックデザインの制作支援や自動生成技術を研究するとともに、メディア理解の基盤となる評価指標やモデルの分析方法の開発も行うなど、応用研究だけでなく基礎研究にも注力をしています。
「Difficulty Controlled Diffusion Model for Synthesizing Effective Training Data」
Zerun Wang(サイバーエージェント※5/東京大学)・ Jiafeng Mao・ Xueting Wang(サイバーエージェント AI Lab) ・山崎俊彦(東京大学)
当社では、技術者のスキル向上を目的とした「CAゼミ制度」を通じて、最新技術の研究開発を業務内で推進しています。その取り組みの一環として早稲田大学と連携し、マルチモーダル大規模言語モデル(MLLM)の評価基盤や応用技術の研究にも注力してまいりました。
AIエージェントの高度化においては、モデルそのものの進化だけでなく、その能力を適切に測定する評価手法の整備が欠かせません。当社では、この評価領域の強化を重要なテーマと位置づけ、AIエージェント技術の発展に貢献することを目指しています。
「VIR-Bench: Evaluating Geospatial and Temporal Understanding of MLLMs via Travel Video Itinerary Reconstruction」
Hao Wang(早稲田大学)・村田栄樹(サイバーエージェント AI事業本部/AI Shift) Lingfang Zhang(早稲田大学)・佐藤郁子(サイバーエージェント AI事業本部)・ 福田創(早稲田大学)・Ziqi Yin(早稲田大学)・ Wentao Hu(早稲田大学)・ 中尾圭佑(早稲田大学) ・中村友亮(早稲田大学)・ Sebastian Zwirner(早稲田大学)・ Yi-Chia Chen(早稲田大学)・大友寛之(サイバーエージェント AI事業本部)・ 大内啓樹(奈良先端科学技術大学院大学/サイバーエージェント AI Lab) ・河原大輔(早稲田大学)
なかでもクリエイティブ領域における研究チームでは、当社が提供する「極予測シリーズ」をはじめとしたクリエイティブ表現全般に関わるグラフィックデザインの制作支援や自動生成技術を研究するとともに、メディア理解の基盤となる評価指標やモデルの分析方法の開発も行うなど、応用研究だけでなく基礎研究にも注力をしています。
「Difficulty Controlled Diffusion Model for Synthesizing Effective Training Data」
Zerun Wang(サイバーエージェント※5/東京大学)・ Jiafeng Mao・ Xueting Wang(サイバーエージェント AI Lab) ・山崎俊彦(東京大学)
| 近年、ノイズから段階的に情報を足していくことで、新しいデータを創り出す生成拡散モデル(Diffusion Model)を用いた学習データの合成が、AIの性能を高めるための重要な手段として注目されています。しかし、既存の手法は単に生成画像を実データ(現実のデータ)の分布に一致させることのみを追求しており、「典型的で容易な」サンプルばかりが生成され、実データセット中の希少ながらも重要な「困難なサンプル(例:判断が難しい例外的なデータ)」をカバーすることが困難でした。 実際、こうした困難サンプルこそが、AIの分類器の「汎化性能」(未知のデータに対する適用能力)と「ロバスト性」(想定外の状況に対する頑健さ)を高める鍵となります。 本研究では、この課題を「データの難易度を制御しながら合成する技術」として新たに定義し、「難易度制御拡散モデル(Difficulty-Controlled Diffusion Model)」を提案しました。まず、基本となるAIの識別モデルであるベースライン分類器を用いて実サンプルに「難易度スコア」(どれだけAIにとって難しいかの指標)を付与し、クラス情報(例:犬種の「イングリッシュ・スプリンガー・スパニエル」や魚種の「テンチ」、あるいは「チェーンソー」「教会の建物」といった、様々なカテゴリの特定種類の分類)と難易度情報を「条件(指示)」として拡散モデルに入力することで、容易なものから困難なものまで、要求に応じて異なる特徴複雑度を持つ合成画像を必要に応じて生成できるようにしました。 多数の実験により、AIにとって適度な高難易度の合成データを加えることで、その後のタスクを行う下流モデルの性能が大幅に向上し、実データセットにおける周辺サンプル(データセットの端にある、不足しがちなデータ)の不足を補完できることが示され、データ拡張とモデル学習に新たな可能性を見出しました。 |
当社では、技術者のスキル向上を目的とした「CAゼミ制度」を通じて、最新技術の研究開発を業務内で推進しています。その取り組みの一環として早稲田大学と連携し、マルチモーダル大規模言語モデル(MLLM)の評価基盤や応用技術の研究にも注力してまいりました。
AIエージェントの高度化においては、モデルそのものの進化だけでなく、その能力を適切に測定する評価手法の整備が欠かせません。当社では、この評価領域の強化を重要なテーマと位置づけ、AIエージェント技術の発展に貢献することを目指しています。
「VIR-Bench: Evaluating Geospatial and Temporal Understanding of MLLMs via Travel Video Itinerary Reconstruction」
Hao Wang(早稲田大学)・村田栄樹(サイバーエージェント AI事業本部/AI Shift) Lingfang Zhang(早稲田大学)・佐藤郁子(サイバーエージェント AI事業本部)・ 福田創(早稲田大学)・Ziqi Yin(早稲田大学)・ Wentao Hu(早稲田大学)・ 中尾圭佑(早稲田大学) ・中村友亮(早稲田大学)・ Sebastian Zwirner(早稲田大学)・ Yi-Chia Chen(早稲田大学)・大友寛之(サイバーエージェント AI事業本部)・ 大内啓樹(奈良先端科学技術大学院大学/サイバーエージェント AI Lab) ・河原大輔(早稲田大学)
| 本論文は、マルチモーダル大規模言語モデル(MLLM)の動画理解能力を再検証したものです。従来の評価は室内の短い動画や近距離の活動に偏っており、実世界で重要な「長距離・長時間の移動を含む動画」の理解はほとんど測られていませんでした。しかし、旅の動画のように空間と時間が大きく変化する状況を読み解く力は、自律移動ロボットの計画やナビゲーションなどに不可欠です。 そこで、200本の旅行動画からなる新しいベンチマーク「VIR-Bench」を作成しました。VIR-Benchは、旅行動画を入力としてその旅程を再構築する正確性を計測することでMLLMの時空間的認識能力を測るベンチマークです。実験の結果、最先端モデルでも高いスコアを出すのは難しく、長距離・長時間の動画理解が依然として大きな課題であることが示されました。 また、VIR-Benchで得た知見を活用し、旅行の動画を入力として旅行プランを提案するAIエージェントも試作しています。このエージェントは精度の高い旅程を提示し、今回の評価方法が実際のサービス改善にも役立つことが確認されました。 本研究は、MLLMが現実世界の複雑な動画を理解するにはまだ課題が残る一方、長距離移動の理解を評価する枠組みがアプリケーションの性能向上にもつながることを示し、今後のモデル開発に重要な示唆を与えています。 |
■今後
これらの研究の成果は、当社の提供する「極シリーズ」におけるAIの推論・生成性能の向上や、AI Shiftの提供する「AI Worker」シリーズなどAIエージェント関連サービスにおける基礎技術として活用することを目指しております。
「AI Lab」は今後もビジネス・社会課題の解決に向けたAI技術をプロダクトに取り入れるとともに、技術発展と学術発展に貢献するべく、研究・開発に努めてまいります。
※1 「AAAI」Association for the Advancement of Artificial Intelligence
※2 「NeurIPS」 Neural Information Processing Systems ,「ICML」International Conference on Machine Learning ,「KDD」International Conference on Knowledge Discovery and Data Mining
※3 Narita et al. “Efficient Counterfactual Learning from Bandit Feedback” (AAAI 2019) , Garcia et al. “KnowIT VQA: Answering knowledge-based questions about videos” (AAAI 2020) , Nomura et al. “Warm Starting CMA-ES for Hyperparameter Optimization” (AAAI 2021) , Shimano et al. “Computing Strategies of American Football via Counterfactual Regret Minimization” (AAAI 2022 Workshop on Reinforcement Learning in Games),Sun et al.”Daycare Matching in Japan: Transfers and Siblings”(AAAI 2023) , Aziz et al. ”Fairness Concepts for Indivisible Items with Externalities” (AAAI 2023)[リリース] , Sun et al. ”Stable Matchings in Practice: A Constraint Programming Approach” (AAAI 2024) , Fujimoto et al. “Memory Asymmetry Creates Heteroclinic Orbits to Nash Equilibrium in Learning in Zero-Sum Games” (AAAI 2024)[リリース] , Fujimoto et al. “Synchronization in Learning in Periodic Zero-Sum Games Triggers Divergence from Nash Equilibrium” (AAAI 2025) , Ishibashi et al. “Approximate State Abstraction for Markov Games” (AAAI 2025) , Sun et al. “Achieving Balanced Representation in School Choice with Diversity Goals” (AAAI 2025)[リリース]
※4 Artificial Intelligence with Biased or Scarce Data(AIBSD)
※5 東京大学所属・2024/08/01から2025/09/30までリサーチインターンシップに参加。
「AI Lab」は今後もビジネス・社会課題の解決に向けたAI技術をプロダクトに取り入れるとともに、技術発展と学術発展に貢献するべく、研究・開発に努めてまいります。
※1 「AAAI」Association for the Advancement of Artificial Intelligence
※2 「NeurIPS」 Neural Information Processing Systems ,「ICML」International Conference on Machine Learning ,「KDD」International Conference on Knowledge Discovery and Data Mining
※3 Narita et al. “Efficient Counterfactual Learning from Bandit Feedback” (AAAI 2019) , Garcia et al. “KnowIT VQA: Answering knowledge-based questions about videos” (AAAI 2020) , Nomura et al. “Warm Starting CMA-ES for Hyperparameter Optimization” (AAAI 2021) , Shimano et al. “Computing Strategies of American Football via Counterfactual Regret Minimization” (AAAI 2022 Workshop on Reinforcement Learning in Games),Sun et al.”Daycare Matching in Japan: Transfers and Siblings”(AAAI 2023) , Aziz et al. ”Fairness Concepts for Indivisible Items with Externalities” (AAAI 2023)[リリース] , Sun et al. ”Stable Matchings in Practice: A Constraint Programming Approach” (AAAI 2024) , Fujimoto et al. “Memory Asymmetry Creates Heteroclinic Orbits to Nash Equilibrium in Learning in Zero-Sum Games” (AAAI 2024)[リリース] , Fujimoto et al. “Synchronization in Learning in Periodic Zero-Sum Games Triggers Divergence from Nash Equilibrium” (AAAI 2025) , Ishibashi et al. “Approximate State Abstraction for Markov Games” (AAAI 2025) , Sun et al. “Achieving Balanced Representation in School Choice with Diversity Goals” (AAAI 2025)[リリース]
※4 Artificial Intelligence with Biased or Scarce Data(AIBSD)
※5 東京大学所属・2024/08/01から2025/09/30までリサーチインターンシップに参加。