このページの本文へ移動

Menu

メニュー

  • 企業 
  • ニュース 
  • サービス 
  • 技術・クリエイティブ 
  • 採用 
  • 投資家情報 
  • サステナビリティ 
  • CyberAgent Way 

 

プレスリリース

AI Lab、深層学習分野のトップカンファレンス「ICLR 2025」にて2本の論文採択

—音声に対応した人物動画生成、マルチエージェント環境における意思決定を高速に学習可能な手法を提案—

広告

株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、人工知能技術の研究開発組織「AI Lab」におけるリサーチインターンシップ参加者のLiu Haiyang氏※1および研究員の阿部拳之らによる論文が機械学習分野の国際会議「ICLR 2025」※2にて採択されたことをお知らせいたします。

「ICLR」は世界中の研究者によって毎年開催される国際会議で、「ICML」「NeurIPS」※3と並び、機械学習や深層学習の分野で権威あるトップカンファレンスの一つです。本年度は約11,500件の投稿の中から32.08%の論文が採択されました。また、このたび当社から採択された論文のうち「TANGO: Co-Speech Gesture Video Reenactment with Hierarchical Audio Motion Embedding and Diffusion Interpolation」が、Oral(口頭)発表に選出されました。Oralは学会に採択された論文の中でも限られた研究のみに与えられ、2025年では採択率1.8%程度と非常に難易度の高いものです。なお本論文の査読スコアは投稿された全論文中で16位となっています。※4

このたび採択された論文は、2025年4月にシンガポールで開催される「ICLR 2025」での発表を予定しています。

■論文の概要

「TANGO: Co-Speech Gesture Video Reenactment with Hierarchical Audio Motion Embedding and Diffusion Interpolation」
著者:Liu Haiyang(東京大学)・楊興超・秋山朋也・黄源天(サイバーエージェント AI Lab)・Qiaoge Li(無所属)・栗山繁(豊橋技術科学大学・サイバーエージェント AI Lab)・武富貴史(サイバーエージェント AI Lab)
入力された音声に対応する人物ジェスチャ動画を生成する手法を提案しています。この論文では、素材となる動画データのフレームを入力音声に合わせて並び変えることによって新たな動画を生成します。素材動画のフレームを並び変えるアプローチのため、動画全体をすべて生成するアプローチに比べ、高品質なジェスチャ動画を安定して作り出すことが可能となっています。並び変えの際に、音声の発話タイミングとジェスチャの開始タイミングが自然な同期となるようなフレームを選択することが可能となるように新たにAuMoCLIPというネットワークを提案しています。実験により、生成される動画の画質、発話タイミングとジェスチャの動作タイミングの自然さで既存手法よりも高精度な生成が可能であることを示しました。

プロジェクトページ:https://pantomatrix.github.io/TANGO/


「Boosting Perturbed Gradient Ascent for Last-Iterate Convergence in Games」
著者:阿部拳之 (サイバーエージェント AI Lab)・ 坂本充生 (サイバーエージェント AI Lab)・蟻生開人 (サイバーエージェント AI Lab)・岩崎敦(電気通信大学)
近年、大規模言語モデルの学習をはじめとした多くの機械学習タスクにおいて、複数の意思決定モデルが存在する状況下での最適なモデルを学習することが求められてきています。この問題に対し、特定の方向にモデルの更新方法をシフトさせることで、学習の安定化を図るアプローチが注目を集めています。本研究では、そのシフトさせる方向を緩やかに変化させることによって、より速く最適なモデルに収束するような新たなアルゴリズムを提案しました。また実際にこのアルゴリズムを用いた場合に、最速に近い速度で最適なモデルを学習できることを理論的かつ実験的に示しました。

<論文リンク>
https://arxiv.org/abs/2410.02388

これらの研究の成果は生成AIをはじめとした機械学習分野における研究開発の基礎技術になるとともに、極予測シリーズやAIタレントをはじめとした当社のサービスへの活用が期待されています。
「AI Lab」は今後もビジネス・社会課題の解決に向けたAI技術をプロダクトに取り入れるとともに、技術発展と学術発展に貢献するべく、研究・開発に努めてまいります。


※1 東京大学所属・2023/9/6より2024/5/27までリサーチインターンシップに参加
※2 「ICLR」The International Conference on Learning Representations
※3 「NeurIPS」Neural Information Processing Systems
 「ICML」International Conference on Machine Learning
※4 https://papercopilot.com/statistics/iclr-statistics/iclr-2025-statistics/