プレスリリース
AI Lab、自然言語処理分野のトップカンファレンス「EMNLP 2025」にて5本の論文採択

株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、人工知能技術の研究開発組織「AI Lab」におけるリサーチインターンシップ参加者の市原有生希氏※1および研究員の本多右京・陣内佑・佐藤志貴らによる論文5本が、人工知能分野および自然言語処理分野の国際会議「EMNLP 2025(The 2025 Conference on Empirical Methods in Natural Language Processing、以下EMNLP)」※2のFindings※3に4本、Industry Track※4に1本採択されたことをお知らせいたします。なお当社において、「EMNLP」での採択は2年連続となります。
「EMNLP」は世界中の研究者によって定期開催される国際会議で、「ACL」「NAACL」※5と並び、自然言語処理分野(NLP)でもっとも権威ある国際会議のひとつです。このたび採択された論文は、2025年11月に中国の蘇州で開催される「EMNLP 2025」での発表を予定しています。
「EMNLP」は世界中の研究者によって定期開催される国際会議で、「ACL」「NAACL」※5と並び、自然言語処理分野(NLP)でもっとも権威ある国際会議のひとつです。このたび採択された論文は、2025年11月に中国の蘇州で開催される「EMNLP 2025」での発表を予定しています。
■研究背景と論文概要
近年、インターネット広告市場の急速な成長に伴い、広告効果を最大化するためのAI技術を活用したクリエイティブ制作や運用の効率化が注目されています。「AI Lab」では、クリエイティブ領域における様々な技術課題に対して、大学や学術機関との産学連携を強化し、AIで広告効果を最大化する「極シリーズ」をはじめとした幅広いAI技術の研究・開発に注力しています。
なかでも、自然言語処理分野の研究チームでは、「広告テキストの自動生成」や「広告表現の理解」の基礎研究に取り組むとともに、当社が提供するAIで効果の出せる広告テキストを予測・自動生成する「極予測TD(キワミヨソクティーディー)」への技術・知見導入を通じた社会実装に取り組んでいます。
また、強化学習チームではインターネット広告におけるユーザーに合わせた広告クリエイティブ選択の最適化など、「極シリーズ」をはじめとした実際のサービスでの意思決定戦略を対象とした研究を行っており、領域横断での研究も行ってまいりました。
●Industry Track
「Auto-Weighted Group Relative Preference Optimization for Multi-Objective Text Generation Tasks」
著者:市原有生希(奈良先端科学技術大学院大学)・陣内佑 (サイバーエージェント AI Lab)
●Findings
「Distilling Many-Shot In-Context Learning into a Cheat Sheet」
著者:本多右京・村上聡一朗・張培楠 (サイバーエージェント AI Lab)
「Annotation-Efficient Language Model Alignment via Diverse and Representative Response Texts」
著者:陣内佑・本多右京(サイバーエージェント AI Lab)
「BannerBench: Benchmarking Vision Language Models for Multi-Ad Selection with Human Preferences」
著者:大竹啓永(奈良先端科学技術大学院大学)・張培楠・坂井優介(奈良先端科学技術大学院大学)・三田雅人※6・大内啓樹(奈良先端科学技術大学院大学/サイバーエージェント AI Lab)・渡辺太郎(奈良先端科学技術大学院大学)
対話システムチーム研究背景
昨今、業務効率化や顧客サービス向上の目的から、多くの市場でテキストによるAIチャットボットの導入が進むと同時に、コールセンターでの問合せなど音声でコミュニケーションをするサービスや業務もAIによる自動化ニーズが高まっています。
このようなオンライン上でのコミュニケーションの自動化に対する関心の高まりを背景として、AI Labの対話システムチームでは「人間らしく自然で高度なオンライン対話」を可能とするAI技術の研究強化に努めております。
2024年からは、人と共生するロボットやシステムの対話知能に関する研究を専門とする東京科学大学の吉野幸一郎准教授と共に「ユーザーの興味を考慮した自動ヒアリング技術の開発」に取り組んでいます。
「Proactive User Information Acquisition via Chats on User-Favored Topics」
著者:佐藤志貴・馬場惇・邊土名朝飛・岩田伸治・吉本暁文(サイバーエージェント AI Lab)・吉野幸一郎(東京科学大学)
なかでも、自然言語処理分野の研究チームでは、「広告テキストの自動生成」や「広告表現の理解」の基礎研究に取り組むとともに、当社が提供するAIで効果の出せる広告テキストを予測・自動生成する「極予測TD(キワミヨソクティーディー)」への技術・知見導入を通じた社会実装に取り組んでいます。
また、強化学習チームではインターネット広告におけるユーザーに合わせた広告クリエイティブ選択の最適化など、「極シリーズ」をはじめとした実際のサービスでの意思決定戦略を対象とした研究を行っており、領域横断での研究も行ってまいりました。
●Industry Track
「Auto-Weighted Group Relative Preference Optimization for Multi-Objective Text Generation Tasks」
著者:市原有生希(奈良先端科学技術大学院大学)・陣内佑 (サイバーエージェント AI Lab)
プロダクトで用いる大規模言語モデル (LLM) に求められる要件は、精度だけでなく、複数の要件が同時に存在することが多いです。一方、既存のLLMの学習方法 (GRPO) は複数の要件を同時に満たすように学習することが困難でした。本研究では、それぞれの要件の習熟度を推定することで全ての与えられた要件を漏れなく、満遍なく学習する手法を提案しました。また、その手法を用いて可読性・多様性・指示応答性を同時に改善した広告文生成LLMを開発しました。 論文リンク:TBA |
●Findings
「Distilling Many-Shot In-Context Learning into a Cheat Sheet」
著者:本多右京・村上聡一朗・張培楠 (サイバーエージェント AI Lab)
大規模言語モデル(LLM)を用いて特定のタスクに取り組む際には、いくつかの例を提示して推論させる「文脈内学習」が広く用いられています。文脈内学習は手軽に行える一方、与える例を増やして性能向上を図ると、入力トークン数の増加に伴い費用や処理時間といった計算コストが膨らむという課題があります。本研究では、大量の例から学ぶべき要点をあらかじめLLMで要約しておいてその要約のみを用いて推論する手法を検証し、性能を維持したまま計算コストを大幅に削減できることを示しました。これにより、大規模な学習データを要するタスクに対しても、LLMを低コストかつ手軽に活用できるようになることが期待されます。 |
「Annotation-Efficient Language Model Alignment via Diverse and Representative Response Texts」
著者:陣内佑・本多右京(サイバーエージェント AI Lab)
強化学習によって大規模言語モデルを使いやすいシステムにするためには、人間によるフィードバック(アノテーション)を多く必要とします。しかしながら、特に医療や法などの専門知識を要する領域では、人間のフィードバックは非常に高額になります。本研究では限られたフィードバックから効率的に学習を行うための手法を提案し、およそ半数のフィードバックのみで既存手法と同程度の性能を得ることが出来ました。 |
「BannerBench: Benchmarking Vision Language Models for Multi-Ad Selection with Human Preferences」
著者:大竹啓永(奈良先端科学技術大学院大学)・張培楠・坂井優介(奈良先端科学技術大学院大学)・三田雅人※6・大内啓樹(奈良先端科学技術大学院大学/サイバーエージェント AI Lab)・渡辺太郎(奈良先端科学技術大学院大学)
近年、画像とテキストの双方を扱える大規模視覚言語モデル (VLM) の性能が著しく向上しています。インターネット広告で多数を占めるバナー広告は画像とテキストで構成されるため、VLMによる広告品質評価の自動化が期待されます。 そこで本研究では、VLMが人間の好みをどの程度再現できるかを測るため、新たなベンチマーク「BannerBench」を構築しました。本ベンチマークは、1つのランディングページから生成した5枚のバナーに対し、順位付けするタスクと最良の1枚を選ぶタスクから構成されています。実験を通して、順位付けタスクでは人間との相関が中程度だったものの、最良選択タスクでは偶然に近い精度に留まりました。 これは、VLMが人間の平均的な選好を捉えることはできても、決定的な選択を行うことは難しいことを示唆しています。以上の結果は、現行のVLMの限界を明らかにすると同時に、今後の発展可能性を示すものです。 論文リンク:TBA |
対話システムチーム研究背景
昨今、業務効率化や顧客サービス向上の目的から、多くの市場でテキストによるAIチャットボットの導入が進むと同時に、コールセンターでの問合せなど音声でコミュニケーションをするサービスや業務もAIによる自動化ニーズが高まっています。
このようなオンライン上でのコミュニケーションの自動化に対する関心の高まりを背景として、AI Labの対話システムチームでは「人間らしく自然で高度なオンライン対話」を可能とするAI技術の研究強化に努めております。
2024年からは、人と共生するロボットやシステムの対話知能に関する研究を専門とする東京科学大学の吉野幸一郎准教授と共に「ユーザーの興味を考慮した自動ヒアリング技術の開発」に取り組んでいます。
「Proactive User Information Acquisition via Chats on User-Favored Topics」
著者:佐藤志貴・馬場惇・邊土名朝飛・岩田伸治・吉本暁文(サイバーエージェント AI Lab)・吉野幸一郎(東京科学大学)
ユーザーの生活を支える対話システムが個々に合った情報やサービスを提供するうえでは、ユーザーの関心や直面する困難などのヒアリングが重要です。しかし、ユーザーが興味を持てない会話を通じたヒアリングは、ユーザーの負担を生み継続的利用を困難にします。本研究では、BDI(Belief-Desire-Intentionモデルを応用した仕組み※7)モデルベースの自動ヒアリング対話システムを考案することで、ユーザーが興味を持つ話題に関する雑談を通じたヒアリングを可能にしました。 |
■今後
今回採択された研究成果は、当社が取り組む「極シリーズ」をはじめとする広告領域への実装に直結するものです。大規模言語モデルの効率的な活用手法は、「極予測TD」における広告テキストの自動生成精度や運用効率の向上に貢献することが期待されます。また、視覚言語モデルを用いた広告バナーの評価手法は、広告クリエイティブの品質理解や自動選択技術の高度化に寄与し、強化学習による意思決定最適化の研究とあわせて、より効果的な広告配信を実現するものです。
さらに、対話システムチームによる自動ヒアリング技術の研究成果は、ユーザーとの自然なコミュニケーションを通じた要望や状況の把握を可能とし、サービス体験の向上や顧客接点の効率化につながります。
今後も「AI Lab」では、最先端のAI技術研究に取り組み、より使いやすく高性能なLLMの開発を進めるとともに、強化学習の実用化と進展に貢献してまいります。
※1 奈良先端科学技術大学院大学所属 2024/04/01よりリサーチインターンシップに参加
※2 「EMNLP」Conference on Empirical Methods in Natural Language Processing
※3 https://2022.naacl.org/blog/authors-faq/#q-findings
※4 言語技術の学術研究と産業応用の相互作用を強調し、実際に社会実装された言語技術の研究成果・課題・ベストプラクティスを共有するトラック。
https://2025.emnlp.org/calls/industry_track/
※5「ACL」Annual Meeting of the Association for Computational Linguistics
「NAACL」Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics
※6 所属は投稿当時
※7
・Belief(信念):システムが持つ情報や理解(例:ユーザーが健康に関心があると認識)
・Desire(欲求):システムが達成したい目標(例:ユーザーの健康状態を把握する)
・Intention(意図):実際に取る行動計画(例:「最近の運動習慣について雑談を交えて聞く」)
という考え方で行動を組み立てるフレームワーク。
さらに、対話システムチームによる自動ヒアリング技術の研究成果は、ユーザーとの自然なコミュニケーションを通じた要望や状況の把握を可能とし、サービス体験の向上や顧客接点の効率化につながります。
今後も「AI Lab」では、最先端のAI技術研究に取り組み、より使いやすく高性能なLLMの開発を進めるとともに、強化学習の実用化と進展に貢献してまいります。
※1 奈良先端科学技術大学院大学所属 2024/04/01よりリサーチインターンシップに参加
※2 「EMNLP」Conference on Empirical Methods in Natural Language Processing
※3 https://2022.naacl.org/blog/authors-faq/#q-findings
※4 言語技術の学術研究と産業応用の相互作用を強調し、実際に社会実装された言語技術の研究成果・課題・ベストプラクティスを共有するトラック。
https://2025.emnlp.org/calls/industry_track/
※5「ACL」Annual Meeting of the Association for Computational Linguistics
「NAACL」Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics
※6 所属は投稿当時
※7
・Belief(信念):システムが持つ情報や理解(例:ユーザーが健康に関心があると認識)
・Desire(欲求):システムが達成したい目標(例:ユーザーの健康状態を把握する)
・Intention(意図):実際に取る行動計画(例:「最近の運動習慣について雑談を交えて聞く」)
という考え方で行動を組み立てるフレームワーク。