プレスリリース
AI Lab、コンピュータ・ビジョン分野のトップカンファレンス「ICCV 2025」にて3本の論文採択

株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田 晋、東証プライム市場:証券コード4751)は、AI技術の研究開発組織「AI Lab」において、リサーチインターンシップ参加者のMingfang Zhang氏(東京大学生産技術研究所佐藤洋一研究室博士課程)※1、Kang-Jun Liu氏(東北大学岡谷研究室博士課程)※2およびAI Lab研究員の曹 旭、鈴木 智之らによる論文3本が、コンピュータ・ビジョン分野の国際会議「ICCV 2025 (International Conference on Computer Vision)」※3 にて採択されたことをお知らせいたします。
「ICCV」は隔年開催されるコンピュータ・ビジョンおよび画像認識分野の国際会議で、「CVPR」※4「ECCV」※5 などと並び、本分野で最も権威のある学会の一つです。
この度採択された論文は、2025年10月にハワイ・ホノルルで開催される「ICCV 2025」で発表予定です。
「ICCV」は隔年開催されるコンピュータ・ビジョンおよび画像認識分野の国際会議で、「CVPR」※4「ECCV」※5 などと並び、本分野で最も権威のある学会の一つです。
この度採択された論文は、2025年10月にハワイ・ホノルルで開催される「ICCV 2025」で発表予定です。
■採択された3本の論文について
●クリエイティブ領域 研究背景
「AI Lab」ではマーケティング全般に関わる幅広いAI技術を研究・開発しており、大学・学術機関との産学連携を強化しながら様々な技術課題に取り組んでいます。なかでもクリエイティブ領域における研究チームでは、当社が提供する「極予測シリーズ」をはじめとしたクリエイティブ表現全般に関わるグラフィックデザインの制作支援や自動生成技術を研究するとともに、メディア理解の基盤となる評価指標やモデルの分析方法の開発も行うなど、応用研究だけでなく基礎研究にも注力をしています。
また、CG分野の研究チームでは、CG技術を活用したクリエイティブ制作支援技術の研究開発を行っています。
「LayerD: Decomposing Raster Graphic Designs into Layers」
著者:鈴木 智之(サイバーエージェント AI Lab)・Kang-Jun Liu(東北大学)・井上 直人※6・山口 光太(サイバーエージェント AI Lab)
「Neural Multi-View Self-Calibrated Photometric Stereo without Photometric Stereo Cues」
著者:曹 旭・武富 貴史(サイバーエージェント AI Lab)
●Activity Understandingチーム 研究背景
2023年に発足したActivity Understanding(行動理解)チームにおいては、実世界における人々の行動を理解することで、より効果的なAIサービスを提供することを目指し研究を行っており、既に当社が展開するリテールメディア事業において、小売実店舗向け動線推定システムに関する研究をはじめとした社会実装を進めてまいりました。
「Egocentric Action-aware Inertial Localization in Point Clouds with Vision-Language Guidance」
著者:Mingfang Zhang(東京大学)・ 米谷 竜(サイバーエージェント AI Lab)・ Yifei Huang・Liangyang Ouyang・Ruicong Liu・佐藤 洋一(東京大学)
「AI Lab」ではマーケティング全般に関わる幅広いAI技術を研究・開発しており、大学・学術機関との産学連携を強化しながら様々な技術課題に取り組んでいます。なかでもクリエイティブ領域における研究チームでは、当社が提供する「極予測シリーズ」をはじめとしたクリエイティブ表現全般に関わるグラフィックデザインの制作支援や自動生成技術を研究するとともに、メディア理解の基盤となる評価指標やモデルの分析方法の開発も行うなど、応用研究だけでなく基礎研究にも注力をしています。
また、CG分野の研究チームでは、CG技術を活用したクリエイティブ制作支援技術の研究開発を行っています。
「LayerD: Decomposing Raster Graphic Designs into Layers」
著者:鈴木 智之(サイバーエージェント AI Lab)・Kang-Jun Liu(東北大学)・井上 直人※6・山口 光太(サイバーエージェント AI Lab)
本研究ではグラフィックデザインをレイヤーに分解する技術を提案しました。一度画像化されたデザインはレイヤー構造が失われてしまいますが、提案した技術によりそれらの再編集が可能となります。提案手法ではレイヤー分解を最も手前にあるデザイン要素抽出の繰り返しという単純な問題に捉え直すことで、高品質な分解を実現しました。
![]() |
「Neural Multi-View Self-Calibrated Photometric Stereo without Photometric Stereo Cues」
著者:曹 旭・武富 貴史(サイバーエージェント AI Lab)
本研究では、スマートフォンのようなカメラとフラッシュライトが固定されているようなデバイスで撮影された複数視点の逐次照明画像から、物体の高精細な形状と材質を復元する手法を提案しました。光源方向と強度を同時に推定することで、既存の方法で必要な煩雑な事前光源校正を不要とし、撮影プロセスの簡略化を実現しています。復元された形状および材質を用いて、写実的な再照明およびレンダリングが可能 となります。 ![]() 本研究の成果は、実写と見間違うような写実的なコンテンツ制作の実現に貢献することが期待されます。 |
●Activity Understandingチーム 研究背景
2023年に発足したActivity Understanding(行動理解)チームにおいては、実世界における人々の行動を理解することで、より効果的なAIサービスを提供することを目指し研究を行っており、既に当社が展開するリテールメディア事業において、小売実店舗向け動線推定システムに関する研究をはじめとした社会実装を進めてまいりました。
「Egocentric Action-aware Inertial Localization in Point Clouds with Vision-Language Guidance」
著者:Mingfang Zhang(東京大学)・ 米谷 竜(サイバーエージェント AI Lab)・ Yifei Huang・Liangyang Ouyang・Ruicong Liu・佐藤 洋一(東京大学)
本研究では、眼鏡型のAIデバイス(スマートグラス)に搭載された慣性センサーから得られる頭部の動きと、周辺環境の3D地図情報を活用し、装着者が「今どこにいて、何をしているのか」を高い精度で推定できる新技術を提案しました。本技術の最大の特長は、AIモデルが「特定の頭部の動き」と「行動が行われる場所」を関連付けて学習する点にあります。たとえば、同モデルは「洗い物特有の動き」を検知し、それが「キッチンシンク周辺」で行われているという地図情報と照合することで、ユーザーの移動と行動を正確に推定します。カメラを使わずに動きだけで判断する仕組みのため、映像によるプライバシーの問題がなく、バッテリーの消耗も抑えられるという特長があります。本技術は、店舗や倉庫をはじめ、様々な作業現場での作業支援など、安心・安全な活用が期待されます。 なお本技術は、弊社と東京大学 生産技術研究所 佐藤洋一研究室との共同研究によって実現しました。 動画URL:https://www.youtube.com/watch?v=KZJrFzUnq_Q |
■今後
これらの研究は、生成AI分野における研究開発の基礎技術として多岐にわたる応用が期待されます。
具体的には、クリエイティブ領域では「極予測シリーズ」への活用や、「広告に用いるデジタルヒューマン」の品質向上を通じて、関連コンテンツの制作環境の効率化に貢献します。
また、実世界における人物行動理解の基礎技術としては、さまざまなセンサーやデバイスを活用し、特に小売業における実店舗作業の支援・効率化につながります。
AI Labは今後も、これらのAI技術を取り入れ、より高品質な広告制作の実現、そしてより高度な計測・支援技術の実現を目指し、研究・開発に努めてまいります。
※1 東京大学所属・2024/04/01から2024/6/30までリサーチインターンシップに参加。現在は「AI Lab」と東京大学 生産技術研究所 佐藤洋一研究室との共同研究として同テーマの研究に継続して取り組んでいます。
※2 東北大学所属・2025/02/05から2025/3/31までリサーチインターンシップに参加。
※3 「International Conference on Computer Vision」
※4 「Conference on Computer Vision and Pattern Recognition」
※5 「European Conference on Computer Vision」
※6 所属は採択当時
具体的には、クリエイティブ領域では「極予測シリーズ」への活用や、「広告に用いるデジタルヒューマン」の品質向上を通じて、関連コンテンツの制作環境の効率化に貢献します。
また、実世界における人物行動理解の基礎技術としては、さまざまなセンサーやデバイスを活用し、特に小売業における実店舗作業の支援・効率化につながります。
AI Labは今後も、これらのAI技術を取り入れ、より高品質な広告制作の実現、そしてより高度な計測・支援技術の実現を目指し、研究・開発に努めてまいります。
※1 東京大学所属・2024/04/01から2024/6/30までリサーチインターンシップに参加。現在は「AI Lab」と東京大学 生産技術研究所 佐藤洋一研究室との共同研究として同テーマの研究に継続して取り組んでいます。
※2 東北大学所属・2025/02/05から2025/3/31までリサーチインターンシップに参加。
※3 「International Conference on Computer Vision」
※4 「Conference on Computer Vision and Pattern Recognition」
※5 「European Conference on Computer Vision」
※6 所属は採択当時