AI Lab研究員の井上 直人が、一般社団法人電子情報通信学会、情報・システムソサイエティ、ヒューマンコミュニケーショングループ、一般社団法人情報処理学会(FIT2023幹事学会)の4者が主催する「第22回 情報科学技術フォーラム(FIT2023)」のトップカンファレンスセッションに登壇し、CVPRで採択された2本の論文について発表します。
■ 参加登録方法
以下URLより、ご登録いただけます。(学会サイト)
https://www.ipsj.or.jp/event/fit/fit2023/adv_reserve.html
■ 登壇概要
■ 参加登録方法
以下URLより、ご登録いただけます。(学会サイト)
https://www.ipsj.or.jp/event/fit/fit2023/adv_reserve.html
■ 登壇概要
日時 | 9月8日(木) 14:30~14:50 |
テーマ | (i) LayoutDM: 離散拡散モデルを用いた制御性の高いレイアウト生成 (ii) 柔軟なマルチモーダル文書処理モデルに向けて |
発表概要 | (i) 本研究では、様々なユーザー指示を入力とするレイアウト生成を単一モデルで実現することを提案する。提案手法は、離散拡散モデルと、その逐次生成過程で指示を予測の補正項として反映する手法からなり、様々なデータセットと指示において高い性能を達成した。 (ii) 本研究では、グラフィックデザインの編集案を提示する機械学習モデルを提案する。様々な編集をマルチモーダルなデータ上での穴埋め問題とみなすことで、同一フレームワークで表現する。実験では、webやバナーといったデータセットでの有効性を示した。 |
登壇者 | 株式会社サイバーエージェント AI Lab 研究員 井上 直人(いのうえ なおと) 2021年3月に東京大学大学院情報理工学系研究科電子情報学専攻で博士後期課程を修了し、博士(情報理工学)を取得。同年に株式会社サイバーエージェントに入社し、AI Labに所属。リサーチサイエンティストとして研究に従事。デザイン支援と理解を対象としたコンピュータビジョンの研究が現在の主な専門。 personal page : https://naoto0804.github.io/ |