プレスリリース
AI Lab、情報検索・推薦システム分野のトップカンファレンス「SIGIR 2024」にて論文採択
ー原文書の重要情報とクエリ関連性を捉えたクエリ指向要約モデルを提案ー
株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、人工知能技術の研究開発組織「AI Lab」に所属する研究員の村上聡一朗ならびに張培楠、東京工業大学のYe Xiong氏、上垣外英剛特別研究員※1、高村大也特別研究員※2、同科学技術創成研究院 未来産業技術研究所の奥村学教授らによる共著論文が情報検索・推薦システム分野の国際会議「The 47th International ACM SIGIR Conference on Research and Development in Information Retrieval(SIGIR 2024)」※3にて採択されたことをお知らせいたします。
「SIGIR」は世界中の研究者によって毎年開催される国際会議で、情報検索・推薦システムの分野でもっとも権威ある国際会議の一つです。この度採択された論文は、2024年7月にアメリカ・ワシントンD.C.にて開催される「SIGIR 2024」で発表予定です。
「SIGIR」は世界中の研究者によって毎年開催される国際会議で、情報検索・推薦システムの分野でもっとも権威ある国際会議の一つです。この度採択された論文は、2024年7月にアメリカ・ワシントンD.C.にて開催される「SIGIR 2024」で発表予定です。
■背景
「AI Lab」ではマーケティング全般に関わる幅広いAI技術を研究・開発しており、大学・学術機関との産学連携を強化しながら様々な技術課題に取り組んでいます。これまで自然言語処理分野の研究チームでは、より効果の高い広告テキストの制作に向けて、東京工業大学の上垣外英剛特別研究員、高村大也特別研究員、奥村学教授とともに、広告テキストの自動生成技術や広告表現の理解に関する共同研究に取り組んでいます。
効果的な広告テキストの制作には、ユーザーの興味を惹く情報を的確に提供することが重要です。しかし、ユーザーの興味との関連性を担保したテキスト生成技術には依然として多くの課題が残っており、自然言語処理分野では文書要約や質問応答など様々なタスクにおいて研究が進められています。
効果的な広告テキストの制作には、ユーザーの興味を惹く情報を的確に提供することが重要です。しかし、ユーザーの興味との関連性を担保したテキスト生成技術には依然として多くの課題が残っており、自然言語処理分野では文書要約や質問応答など様々なタスクにおいて研究が進められています。
■論文の概要
このたび採択された「Grasping Both Query Relevance and Essential Content for Query-focused Summarization」では、ユーザーの興味関心を表すクエリ※4を考慮した要約を生成する、クエリ指向要約(Query Focused Summarization、以下QFS)タスクに焦点を当てています。
これまでQFSの研究においては、事前学習モデルやクエリ応答の関連性を基にした手法など、多くの手法が提案されています。しかし、従来手法では依然としてクエリと原文書、原文書と生成要約の間の相互関係を効果的に捉えることが難しく、その結果、生成要約にクエリと関連した内容や重要な情報が十分に含まれないという課題を抱えていました。
本研究では、原文書中の各文の重要度を予測し、その結果を利用して要約を生成する二段階のQFSモデルを提案しました。さらに、クエリと原文書を別々にエンコードし、これらの関連性を階層型クロスアテンションにより捉えることで、よりクエリに応じた精度の高い要約を生成することが可能となりました。実験では2つのQFSベンチマークにおいて、従来の最高性能モデルを上回る性能を示し、提案手法の有用性を確認しました。
本研究により、ユーザーが求める情報に対してより関連性のある応答を生成することが可能となり、広告文の自動生成技術のさらなる精度向上が期待されます。
これまでQFSの研究においては、事前学習モデルやクエリ応答の関連性を基にした手法など、多くの手法が提案されています。しかし、従来手法では依然としてクエリと原文書、原文書と生成要約の間の相互関係を効果的に捉えることが難しく、その結果、生成要約にクエリと関連した内容や重要な情報が十分に含まれないという課題を抱えていました。
本研究では、原文書中の各文の重要度を予測し、その結果を利用して要約を生成する二段階のQFSモデルを提案しました。さらに、クエリと原文書を別々にエンコードし、これらの関連性を階層型クロスアテンションにより捉えることで、よりクエリに応じた精度の高い要約を生成することが可能となりました。実験では2つのQFSベンチマークにおいて、従来の最高性能モデルを上回る性能を示し、提案手法の有用性を確認しました。
本研究により、ユーザーが求める情報に対してより関連性のある応答を生成することが可能となり、広告文の自動生成技術のさらなる精度向上が期待されます。
■今後
本研究の成果は、自然言語処理分野における研究開発の基礎技術になるとともに、「極予測シリーズ」※5や「AI Messenger Chatbot」をはじめとした当社および当社グループの提供する実サービスへの活用等が期待されます。今後も「AI Lab」はAI技術を取り入れたより品質の高い広告制作の実現を目指し、研究・開発に努めてまいります。
※1 本務:奈良先端科学技術大学院大学 先端科学技術研究科 准教授
※2 本務:国立研究開発法人産業技術総合研究所 人工知能研究センター 知識情報研究チーム長
※3 SIGIR 2024(The 47th International ACM SIGIR Conference on Research and Development in Information Retrieval)
※4 データベースに対する命令文のことであり、例えば検索エンジンに入力する検索しようとする語句および文章を指す。
※5 「極予測AI」「極予測TD」「極予測LP」をはじめとした、AIによる効果の高いインターネット広告クリエイティブの効果予測および生成AIを活用した広告素材の自動生成などのクリエイティブ制作支援サービス
※1 本務:奈良先端科学技術大学院大学 先端科学技術研究科 准教授
※2 本務:国立研究開発法人産業技術総合研究所 人工知能研究センター 知識情報研究チーム長
※3 SIGIR 2024(The 47th International ACM SIGIR Conference on Research and Development in Information Retrieval)
※4 データベースに対する命令文のことであり、例えば検索エンジンに入力する検索しようとする語句および文章を指す。
※5 「極予測AI」「極予測TD」「極予測LP」をはじめとした、AIによる効果の高いインターネット広告クリエイティブの効果予測および生成AIを活用した広告素材の自動生成などのクリエイティブ制作支援サービス