プレスリリース

AI Lab、計算社会科学の国際査読誌「Journal of Computational Social Science」にて共著論文採択 ー非負値テンソル分解による、購買データ解析手法を提案ー

広告

株式会社サイバーエージェント(本社:東京都渋谷区、代表取締役社長:藤田晋、東証一部上場:証券コード4751)は、人工知能技術の研究開発組織「AI Lab」に所属する研究員の森脇大輔と、南カリフォルニア大学の松井暉氏、Emilio Ferrara研究助教、神戸大学の小林照義准教授による共著論文が、計算社会科学の英文査読誌である「Journal of Computational Social Science」( ※1)にて採択されたことをお知らせいたします。
 
計算社会科学は2000年代後半以降、インターネットの普及拡大とともに急速に発展している社会科学と計算機科学の融合分野(※2)で、「Journal of Computational Social Science」は2018年に創刊された、計算社会科学分野における世界初の国際的な英文査読誌です。


■研究背景
「AI Lab」ではマーケティング全般に関わる幅広いAI技術を研究開発しており、大学・学術機関との産学連携を強化しながら様々な技術課題に取組むとともに、産学連携によって培ってきた技術を当社のビジネス課題と結びつけるような、より実践的な研究開発を行ってまいりました。

これまで消費者の行動に関する分析では、家計調査や全国消費実態調査などの消費統計を用いることが主流でしたが、近年、POSデータや家計簿データのような消費者の詳細な購買行動データが利用可能となったことで新たな展開を見せています。これらの詳細な購買行動データは、単純な消費支出のような消費統計と比べてはるかにリッチな情報を含んでいると考えられ、その活用が期待されていますが、日次の個人消費データはデータ量が膨大な高次元データであり、単純な統計処理では有益な情報を抽出することができません。


■論文概要
このような背景のもと、今回採択された共著論文「Detecting multi-timescale consumption patterns from receipt data: A non-negative tensor factorization approach(※3) 」では、非負値テンソル分解という機械学習の手法で、膨大な消費者の購買データから消費者行動のパターンを抽出するという解析手法を提案しました。消費データから消費者の情報を抽出する研究は、その重要性から多くの研究がなされていますが、本論文は日次の購買の数という単純なデータと、簡便なデータ表現を使い、消費者の情報を抽出した点に貢献があります。

本論文では、2600人以上の消費者の10ヶ月に渡る購買データ(購買の数) 270万レコードを分析し、消費行動に消費者の属性が反映されていることを示しました。

高次元なデータの分析では、「どのようにデータを表現するか」が重要です。データが高次元であるが故に様々な表現が可能な一方、それが結果の解釈や汎用性に直接的な影響を与えると考えられているためです。そして、消費のデータという特性が結果に反映されるようなデータの表現をする必要があり、それには社会科学的な観点からの分析が必要不可欠です。

本論文では消費者の行動を、1) 曜日による違い、2) 週ごとの違いの2つで表現しています。消費者の行動は平日と休日で異なること、給料日や年末などのイベントで消費パターンが変化することは、先行研究や実際のデータでも明らかであるためです。この2つの消費パターンをデータとして表現するため、本論文では曜日毎の購買記録が2部グラフで表現され、それらがテンソルという形式で格納されています。曜日や週による違いの表現は計算機科学では基礎的な表現方法であるため、今回の提案手法は汎用性を持っているといえます。

テンソルに格納された購買データは依然として高次元なデータですが、非負値テンソル分解という手法を用いて、特徴的なパターンを低次元なデータとして抽出しました。これにより、消費者を消費パターンの類似度で分解することが可能になり、似通った消費パターンを持つ消費者は同じような属性を持つことが示されました。


■今後
今回の提案は、様々な消費者行動データを解析する際に用いられ、企業のマーケティング戦略において貢献が期待されます。「AI Lab」は今後もAI技術の研究を重ね、より品質の高い広告技術の実現を目指し、研究・開発に努めてまいります。

※1  Journal of Computational Social Science
※2 瀧川 裕貴, “社会学との関係から見た計算社会科学の現状と課題”, 理論と方法, 2018, 33-1
※3  Akira Matsui, Teruyoshi Kobayashi, Daisuke Moriwaki, Emilio Ferrara  "Detecting multi-timescale consumption patterns from receipt data: A non-negative tensor factorization approach"