
株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、人工知能技術の研究開発組織「AI Lab」におけるリサーチインターンシップ参加者の松尾信之介氏※1ならびに研究員の下田和・楊興超※2らによる論文3本が「CVPR 2025 (Computer Vision and Pattern Recognition)」※3に採択されたことをお知らせいたします。
「CVPR」は、コンピュータ・ビジョン分野における世界最高峰の国際会議のひとつで、画像認識関連技術のトップ研究者が一堂に集う最大規模の学会です。
本年度は13,008件の投稿の中から2,878件(22.12%)の論文が採択されました。また、このたび当社から採択された論文のうち「Type-R: Automatically Retouching Typos for Text-to-Image Generation」が、特に注目すべきハイライト論文(Highlights)として選出されています。なお、AI Labから「CVPR」での採択は4年連続となります。
このたび採択された論文は、2025年6月にアメリカ・テネシー州のナッシュビルで開催される「CVPR 2025」にて発表を行います。
「CVPR」は、コンピュータ・ビジョン分野における世界最高峰の国際会議のひとつで、画像認識関連技術のトップ研究者が一堂に集う最大規模の学会です。
本年度は13,008件の投稿の中から2,878件(22.12%)の論文が採択されました。また、このたび当社から採択された論文のうち「Type-R: Automatically Retouching Typos for Text-to-Image Generation」が、特に注目すべきハイライト論文(Highlights)として選出されています。なお、AI Labから「CVPR」での採択は4年連続となります。
このたび採択された論文は、2025年6月にアメリカ・テネシー州のナッシュビルで開催される「CVPR 2025」にて発表を行います。
■論文の概要
「Instance-wise Supervision-level Optimization in Active Learning」
著者:松尾信之介(九州大学)・富樫陸(サイバーエージェント AI Lab)・備瀬竜馬(九州大学)・内田誠一(九州大学)・野村将寛(サイバーエージェント AI Lab※4)
「Type-R: Automatically Retouching Typos for Text-to-Image Generation」
著者:下田和・ 井上直人・原口大地(サイバーエージェント AI Lab)・三谷勇人(九州大学)・内田誠一(九州大学)・山口光太(サイバーエージェント AI Lab)
「FreeUV: Ground-Truth-Free Realistic Facial UV Texture Recovery via Cross-Assembly Inference Strategy」
著者:楊興超(サイバーエージェントAI Lab/筑波大学)・武富貴史(サイバーエージェントAI Lab)・遠藤結城(筑波大学)・金森由博(筑波大学)
著者:松尾信之介(九州大学)・富樫陸(サイバーエージェント AI Lab)・備瀬竜馬(九州大学)・内田誠一(九州大学)・野村将寛(サイバーエージェント AI Lab※4)
本研究では、能動学習(Active learning)の新たな枠組みを提案しました。能動学習は、限られたアノテーション予算の中で学習効率を最大化することを目的とし、アノテーションを付与するデータを選択する手法です。しかし、従来の能動学習では正確で高コストな完全教師(Full supervision)が一般的に用いられていました。そこで本研究では、大まかではあるものの低コストで情報を提供できる弱教師(Weak supervision)に着目し、アノテーションを付与するデータの選択に加え、各データサンプルに対してFull supervisionとWeak supervisionのどちらの教師レベルを付与するかも最適化することで学習の効率化を目指します。 本手法では、各データおよび各教師レベルに対して、単位コストあたりのアノテーション価値(つまりコストパフォーマンス)を基準とし、限られたアノテーション予算の中で最適な教師レベルを割り当てる手法を提案しました。実験の結果、本手法は従来の能動学習手法と比較して同じ予算でより高い精度を達成できることを確認しました。 本研究の成果は、アノテーションコストを抑えつつ高精度なAIモデルを構築するための新たなアプローチとしてさまざまな機械学習タスクへの応用が期待されます。 |
「Type-R: Automatically Retouching Typos for Text-to-Image Generation」
著者:下田和・ 井上直人・原口大地(サイバーエージェント AI Lab)・三谷勇人(九州大学)・内田誠一(九州大学)・山口光太(サイバーエージェント AI Lab)
本研究ではType-Rという生成された画像内のテキストを自動で補正する手法を提案しています。Type-RはOCR、Text erasing、Layout planning、Text editingといったすでに世の中に存在する技術を活用し、生成された画像を直接編集することでテキストの補正を行います。FluxやStable Diffusion3.5のような汎用的な画像生成モデルにType-Rを適用することで、グラフィックデザインとしてのクオリティの高さと正確なテキストの描画を両立した画像が生成可能であることを示しました。
![]() |
「FreeUV: Ground-Truth-Free Realistic Facial UV Texture Recovery via Cross-Assembly Inference Strategy」
著者:楊興超(サイバーエージェントAI Lab/筑波大学)・武富貴史(サイバーエージェントAI Lab)・遠藤結城(筑波大学)・金森由博(筑波大学)
「FreeUV」という3D顔のUVテクスチャ復元手法を提案しています。FreeUVは、単一の2D顔画像から高品質なUVテクスチャを生成する方法で、特に教師データ(ground-truth UV)の必要がない点が特徴です。本手法は、事前学習済みの拡散モデル(Stable Diffusion)を活用、「クロスアセンブリ推論戦略」を提案することによって、リアルな外観と構造の一貫性を両立させます。これにより、しわ、メイク、遮蔽部分などの複雑な顔の特徴を高精度に再現し、ポーズや照明条件に対する堅牢性を示しました。
![]() |
■今後
これらの研究は、生成AI分野における研究開発の基礎技術になるとともに、「極予測シリーズ」をはじめとした当社のサービスへの活用等が期待されます。「AI Lab」は今後もAI技術を取り入れたより品質の高い広告制作の実現を目指し、研究・開発に努めてまいります。
※1 九州大学所属・2024/03/01よりリサーチインターンシップに参加
※2 AI Lab所属・2023年より筑波大学博士後期課程在学中
※3 The IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR)
※4 所属は採択当時・現在は東京科学大学所属
※1 九州大学所属・2024/03/01よりリサーチインターンシップに参加
※2 AI Lab所属・2023年より筑波大学博士後期課程在学中
※3 The IEEE / CVF Computer Vision and Pattern Recognition Conference (CVPR)
※4 所属は採択当時・現在は東京科学大学所属