このページの本文へ移動

Menu

メニュー

  • 企業 
  • ニュース 
  • サービス 
  • 技術・デザイン 
  • 採用 
  • 投資家情報 
  • サステナビリティ 
  • CyberAgent Way 

 

プレスリリース

AI Lab、情報検索・推薦システム分野のトップカンファレンス「SIGIR2023」にて3本の主著論文採択  

広告

株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役:藤田晋、東証プライム市場:証券コード4751)は、人工知能技術の研究開発組織「AI Lab」に所属する研究員の大坂直人・富樫陸・椎野弘章・蟻生開人・阿部拳之らによる主著論文3本が、情報検索分野の国際会議「The 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2023)」※1 にて採択されたことをお知らせいたします。

「SIGIR」は世界中の研究者によって毎年開催される国際会議で、情報検索・推薦システムの分野でもっとも権威ある国際会議の一つです。この度「AI Lab」から採択された論文は、2023年7月に台湾で開催される「SIGIR 2023」で発表されます。

■採択された3本の主著論文について

「AI Lab」ではマーケティング全般に関わる幅広いAI技術を研究・開発しており、大学・学術機関との産学連携を強化しながら様々な技術課題に取組んでいます。
近年、動画配信プラットフォームやマッチングアプリを含め様々なウェブサービスにおいて、ユーザー毎に好まれるコンテンツを高精度に予測・推薦する技術は、ユーザーの満足度を左右する重要な役割を果たしています。しかし、ユーザーやコンテンツの急激な増加により、推薦システムの学習・予測にかかる膨大なコストが課題となっています。

このような課題から、大量のユーザー・コンテンツに対する効果予測の技術的課題解決を行う領域が注目を集めており、推薦システムに関する主著論文を「WSDM」「WWW」で発表するなど、積極的に共同研究に取組んでまいりました。


「A Critical Reexamination of Intra-List Distance and Dispersion」
Naoto Ohsaka, Riku Togashi

著者: 大坂直人(サイバーエージェント AI Lab)・富樫陸(サイバーエージェント AI Lab)
本研究は、推薦手法における多様性指標の批判的検討を理論的・実験的に行いました。推薦システムの結果に多様性を確保することは、ユーザの情報需要の不確実性やバラエティ・シーキング等の理由で重要であると認識されています。また、推薦結果の多様性を向上させるためには、多様性指標の「定義」と「最適化」が特に肝要です。

我々の研究では、最も有名な多様性指標である Intra-list distance (ILD) と dispersion (or minimum dispersion) を取り上げました。アイテム間の距離尺度が与えられた元で、ILDは「アイテム間の平均距離」として、dispersionは「アイテム間の最小距離」としてそれぞれ定義されます。どちらの指標も導入がしやすく、特に、ILDは20年以上様々な研究で使われ続けてきました。

これら2つの指標は直感的には多様性の概念を捉えているように見える一方、実際に「どのようなアイテム集合を好むのか」・「指標を最適化して得られるアイテム集合の特徴」は定かではありません。
こうした背景から、我々はILDとdispersionとの理論的な比較分析を行い、次の潜在的な欠点を明らかにしました。
・ILDは(距離の意味で)重複あるいは酷似するアイテム対を選びがちである
・一方、dispersionは相違するアイテム対を見逃しうる
さらに、上記の極端な現象が実際に生じることを現実のデータセットを用いた実験により実証しました。


(図の説明) 我々の分析の模式図。楕円上に無作為に撒いた1000点群について、ILDとdispersionを大きくするように128点を選択し、赤丸でプロットしている。ILDが選んだ点は楕円の両端に集中しており、中央の点が一切選択されていないことが分かる。

<論文リンク> https://arxiv.org/abs/2305.13801

「Curse of "Low" Dimensionality in Recommender Systems」
Naoto Ohsaka, Riku Togashi

著者: 大坂直人(サイバーエージェント AI Lab)・富樫陸(サイバーエージェント AI Lab) 
※2名ともが第一著者に該当します
本研究では、推薦システムにおいて用いられるtwo-tower/dot-product modelsと呼ばれるモデル構造の、ユーザ/アイテム表現の埋め込みベクトルの次元数について考察しました。

実用的な推薦システムにおいて用いられる手法は、あるユーザとアイテムを低次元なベクトルとして表現し、そのベクトル間の内積によってユーザのアイテムに対する選好を推定するものが一般的です。このような、ベクトルの内積によって選好をモデル化する構造を一般にtwo-tower/dot-product modelsと呼びます。

本研究では、このモデル構造において次元数の増加に従って性能が飽和する一方で、多様性・公平性等の推薦システムの異なる品質観点に関しては改善し続けることを経験的に発見しました。
ここで得られた仮説は『two-tower/dot-product modelsにおける次元数が小さいと推薦結果の多様性が失われ、将来的なデータ獲得・ひいては長期的な性能が制限される』というものであり、我々はこの現象を”curse of low dimensionality”と名付けました。

さらにこの”curse of low dimensionality”現象を理論的な背景から説明するために、モデルの次元数とモデルが表現可能なランキングの数についての関係を調べ、次元数の現象に従って指数的に表現可能なランキングが少なくなることを示しました。

<論文リンク>https://arxiv.org/abs/2305.13597


「Exploration of Unranked Items in Safe Online Learning to Re-Rank」
Hiroaki Shiino, Kaito Ariu, Kenshi Abe, Riku Togashi

著者: 椎野弘章(サイバーエージェント AI Lab)・蟻生開人(サイバーエージェント AI Lab)・阿部拳之(サイバーエージェント AI Lab)・富樫陸(サイバーエージェント AI Lab)
本研究では、ユーザー体験が著しく損なわれることを避ける、保守的なオンラインランキング学習手法の提案を行いました。
オンラインランキング学習は、ユーザーに提示したアイテム(商品や動画など)のランキングに対するユーザーのフィードバック(クリックなど)を直ちに反映し、次に提示するランキングを改善する技術です。より多くのデータを活用できることから、検索や推薦の分野において、従来のランキング手法よりも高い性能を持つことが実験的に示されています。

一方、既存のオンラインランキング学習手法の多くは、学習初期段階でランダムにアイテムを探索することにより、一時的にユーザーにとって「著しく好ましくないランキング」を表示してしまうことで、サービスからユーザーの離脱を招く可能性を高めてしまうという課題がありました。
この課題を解決するため、保守的なオンラインランキング学習手法では、ユーザーにとって「著しく好ましくないランキング」を一度も提示しないよう、サービスに既に導入されている手法によって作成されたランキング(元のランキング)を利用します。
提案手法ではサービスを利用しているユーザーにとって既に許容できていると考えられる「元のランキング」を起点に徐々にランキングを変化させることでアイテムの探索を行い、サービスからのユーザーの離脱を防ぎつつランキングを改善することを実現しました。

さらに、提案手法では、ランキング外の(表示可能数に収まりきらない)アイテムの探索方法を工夫することで、元のランキング外に存在するがユーザーの選好度が高いアイテムをランキング上位に持ってくることを容易にしています。本論文では、現実の検索データを元にしたシミュレーション実験にて、その優位性を示しました。実サービスでは、アイテム総数がランキングの表示可能数よりも遥かに大きいことが多いため、提案手法の優位性がさらに高くなることが期待されます。

<論文リンク> https://arxiv.org/abs/2305.01202


■今後
今回発表した研究は、AI分野における研究開発の基礎技術になるとともに、実サービスへの活用等が期待されます。「AI Lab」は今後もAI技術を取り入れたより品質の高いサービスの実現を目指し、研究・開発に努めてまいります。


※SIGIR 2023(The 46th International ACM SIGIR Conference on Research and Development in Information Retrieval)  https://sigir.org/sigir2023/