プレスリリース
AI Lab、Web・データマイニング分野の国際会議「The Web Conference 2020」にて論文採択 ~機械学習における正解データの観測が遅延する問題を改善する手法を提案~
「The Web Conference(通称WWW)」は、コンピュータサイエンス・経済学・機械学習から社会問題まで多くの研究分野の視点から研究発表が行われているWeb・データマイニングにおける権威ある国際学会の一つです。この度当社から採択された論文は、2020年4月に台湾・台北で開催される「The Web Conference 2020」において発表が予定されています。※1
■研究背景
「AI Lab」ではマーケティング全般に関わる幅広い人工知能技術を研究開発しており、大学・学術機関との産学連携を強化しながら様々な技術課題に取組むとともに、産学連携によって培ってきた技術を当社のビジネス課題と結びつけるような、より実践的な研究開発を行ってまいりました。
一方で、当社が提供するダイナミックリターゲティング広告「Dynalyst」においては、ユーザーの購買予測に使われる機械学習モデルの性能が、広告配信の効率に大きく影響をもたらすことが知られており、その性能を高めるための継続的な改善が行われています。
このような背景のもと、これまで「AI Lab」にて培ってきた因果推論と機械学習の融合に関する知見を元に提案した手法を「Dynalyst」の広告配信技術へ応用し、実際に広告配信が効率化された結果を示した研究論文が「The Web Conference 2020」に採択されました。
■論文研究の概要
今回採択された共著論文 「 A Feedback Shift Correction in Predicting Conversion Rates under Delayed Feedback」※2では、「ユーザーの購買予測モデルを学習する際、購買データが遅延して観測されることで発生する、教師データにおけるバイアスへの対処法」を提案しました。
▼Delayed Feedbackイメージ図
ユーザーの購買予測モデルを学習する場合、ユーザーの行動履歴と購買履歴をある時点において集めて教師データとします。しかし、その場合「本来購買するユーザーであるものの、教師データを集めたタイミングではまだ購買していないユーザー」が、教師データの中では「購買していないデータ」として扱われることになります。これに対して何の対処も行わない場合、予測モデルは本来の購買確率を下回る予測を行う傾向となり、結果的に予測精度を低下させることになります。これにより、広告配信の機会を損失することになります。
今回の論文では、このような教師データにバイアスが含まれるという問題において、本来の購買確率をより正しく予測できるような学習方法を提案しました。実際の広告配信データを用いた実験では、ユーザーの購買行動の予測において従来の手法よりも高い予測精度を達成し、さらにその実験結果を元に、実際に「Dynalyst」において提案手法を導入しA/Bテストを行った結果では、獲得単価を保ちつつ獲得購買数を約30%増加させることに成功しました。
■今後
今回の研究で扱った購買行動データにおけるバイアスは、広告のみでなく様々な購買行動データにおいて発生するバイアスです。よって、今回提案された手法は今後オンライン・オフラインの応用問わずに様々なところで適応が可能なものと考えられます。
「AI Lab」および「Dynalyst」は、今後も人工知能技術を用いた広告配信技術をプロダクトに取り入れ、より品質の高い広告配信技術の実現を目指し、研究・開発に努めてまいります。
※1 The Web Conference2020 ( https://www2020.thewebconf.org)は2020年4月に台北にて、オンライン発表での開催予定が公表されています。
※2 Yasui, Shota, Gota Morishita, Komei Fujita and Masashi Shibata. "A Feedback Shift Correction in Predicting Conversion Rates under Delayed Feedback." The Web Conference(WWW). 2020.
preprint link: https://arxiv.org/abs/2002.02068