このページの本文へ移動

Menu

メニュー

  • 企業 
  • ニュース 
  • サービス 
  • 技術・デザイン 
  • 採用 
  • 投資家情報 
  • サステナビリティ 
  • CyberAgent Way 

 

登壇

人工知能学会全国大会(JSAI2024)にて共同研究を含む7件の発表、5件のポスターセッション、企画セッションに参加します

2024年5月28日(火)~31日(金)にかけて開催される、2024年度人工知能学会全国大会(JSAI2024)にて、サイバーエージェントグループから、共同研究を含む7件の発表、5つのポスターセッション、企画セッション「機械学習が紡ぐゲーム理論のフロンティア」「人工知能学会の多様性と包摂の推進の取り組みと展開」にてオーガナイザーとして参加します。なおサイバーエージェントはプラチナスポンサーを務めます。


■人工知能学会全国大会について
人工知能学会全国大会は、日本人工知能学会(JSAI)が主催する、人工知能に関する最新の研究成果や知識を共有するための学術会議です。38回目となる今年も、学術機関や企業における人工知能の活用事例や、取り組む研究について学びを深めるプログラムが多数行われます。招待講演・特別セッション・ポスターセッション・企画セッションなどが4日間にわたり、アクトシティ浜松(静岡県浜松市)とオンラインのハイブリッド形式で開催されます。


■発表について

テーマ:
RLHFにおける分布シフトの評価

日時:
5月28日(火)13:20~13:40

発表者:
〇坂本 充生1、森村 哲郎1、陣内 佑1、阿部 拳之1、蟻生 開人1
 (1. 株式会社サイバーエージェント)

概要:
大規模言語モデル(LLM)のFine-Tuningには、Reinforcement Learning from Human Feedback(RLHF)が用いられる。 RLHFは、(1) LLMの Supervised Fine-Tuning(SFT)、(2) 人間の選好に基づくSFTモデルの生成文のランキング評価、(3) 選好データセットを用いた報酬モデルの学習、(4) 報酬モデルを用いたSFTモデルの強化学習、という4つのプロセスからなる。 人間による評価にはコストがかかるため、報酬モデルの学習には公開データセットや過去のデータを用いることが多い。これらのデータ生成モデルとSFTモデルは異なるため、報酬モデルの学習するデータと評価するデータに"分布シフト"が生じる。 本研究では、この影響を分析するためSFTモデル以外に性能が異なる複数のLLMを用いて、選好データセットを作成して、いくつかのシナリオでRLHFを行う。結果を比較することで、分布シフトが問題になる状況を明らかにする。分析の結果、報酬モデルに分布シフトがある場合にRLHFの性能を劣化させることを確認した。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/1B3-GS-2-02/advanced

--------------------------------------------

テーマ:
メディアサービスの個人化推薦システムにおけるパーソナルデータ利用の社会的受容性
ベイズ推定による社会通念と個人的観念に照らし合わせた受容の分析

日時:
5月28日(火)18:00~18:20

発表者:
〇森下 壮一郎1、高野 雅典1、武田 英明2
 (1. 株式会社サイバーエージェント、2. 国立情報学研究所)

概要:
人々の生活の多くがデジタルプラットフォームの上でも営まれるようになり、種々の事業においてパーソナルデータの利活用が盛んに行われている。それぞれの事業に関するデータ利活用の受容性についての利用者の考えを知ることは、社会的に受容される態様でのデータの利活用の指針となるはずである。この考えの下で筆者らは既に、個人データの利用主体と利用目的に応じた社会的受容性についてWebアンケートで調査している。その結果、多くの事業において、社会通念に照らし合わせた場合の受容としての実施の可否と、個人的観念に照らし合わせた場合の受容としての利用の意図には正の相関があったが、実施は受容できないものの利用の意図はあるという場合もあることが見出された。本稿ではこの結果を踏まえて、メディアサービスの個人化推薦システムにおけるパーソナルデータ活用に関するWebアンケートを行い、ベイズ推定を用いて実施の可否と利用の意図の関係について分析する。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/1C5-GS-11-04/advanced
--------------------------------------------

テーマ:
ABEMAにおけるコンテンツ紹介の機械学習を用いた異質処置効果推定

日時:
5月29日(水)10:20~10:40

発表者:
〇宇戸 慎吾1、安井 翔太2
 (1. 株式会社AbemaTV、2. 株式会社サイバーエージェント)

概要:
動画配信サービスのABEMAでは、ユーザーに対してさまざまなコンテンツの推薦を行っている。本稿では、従来推薦される頻度の高かったオンデマンドの配信形式であるビデオコンテンツの代わりに、テレビのような配信形態を持つリニアコンテンツの表示を増加させる実験を行い、その効果を検証した。また、この際に平均的な処置効果だけではなく、異質処置効果の推定を行った。それらの結果として、ユーザーに表示・推薦される種類のコンテンツの視聴が増加すること、そして実験前のユーザーの視聴傾向によってその処置効果が異なることを発見した。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/2O1-GS-3-05/advanced

--------------------------------------------

テーマ:
LLMエージェントによるText-to-Design手法の検討

日時:
5月29日(水)10:20~10:40

発表者:
〇關 百咲1、菊池 康太郎2、井上 直人2、大谷 まゆ2、山口 光太2、シモセラ エドガー1
 (1. 早稲田大学、2. サイバーエージェント)

概要:
ユーザーインターフェースの設計などのデザインタスクは、デザイナーでない人にとって複雑で時間がかかる。デザインを生成する方法には、ピクセル画像を作成したり、自然言語のクエリから特定の形式でデザインを出力するようにモデルをトレーニングしたりする方法などがある。しかしよりソフトウェア依存が少なく、生成結果が編集可能な、一般的なデザイン生成アプローチが必要とされている。提案手法であるDesignPlannerは、大規模言語モデルを用いてデザインタスクを実行できるシステムである。基幹手法は既存のものを利用しており、PlannerとExecutorの2つのコンポーネントで構成されている。Plannerはクエリをサブクエリに分解し、Executorは予め登録された関数を用いてサブクエリを実行する。この基本的な枠組みの性能評価では、既存のコンポーネントの利用や編集など、WebサイトのUIデザインに関連する単純な操作に焦点を当てて実験を行った。その結果、この方法は非常に単純なタスクには有効であるが、やや複雑なタスクでは関数を誤って呼び出すために失敗することが示された。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/2C1-GS-7-05/advanced

--------------------------------------------

テーマ:
ソフトウェアエンジニア志望者における男女差: ロールモデル・会社選びの基準・興味関心

日時:
5月29日(水)17:30~17:50

発表者:
〇高野 雅典1、神谷 優1
(1. 株式会社サイバーエージェント)

概要:
STEM分野の職業では男性比率が多く、その結果、ジェンダーギャップが生じることが多い。例えば、女性が少ないために女性がロールモデルを得づらい、男性が多いために文化や制度が(差別的な意図はなくとも)男性よりになってしまい、少数派の居心地が悪い などである。ソフトウェアエンジニアもその一つである。このようなギャップの要因の一つは「比率に大きな偏りがある」ことである。そのためギャップ解消のためには少数派の人数を増やすことが重要である。そこで本研究ではソフトウェアエンジニア志望者を対象として、ロールモデル・会社選びの基準・興味関心について調査を行い、女性のソフトウェアエンジニア志望者を増やすための施策について検討をした。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/2N6-OS-28b-01/advanced

--------------------------------------------

テーマ:
 対話中の能動的発話を含む発話タイミングの学習の検討

日時:
5月30日(木)16:30~16:50

発表者:
〇中西 惇也1、三好 遼2、岡藤 勇希3、馬場 惇3、吉川 雄一郎1、石黒 浩1
(1. 大阪大学、2. 中京大学、3. 株式会社サイバーエージェント)

概要:
対話サービスではユーザーがテキストや音声を通じて要求を行い、コンピューターシステムが適切な応答を生成し要求に答える(受動的な)プロセスが基本とされている。一方で、ユーザーからの要求に応答するだけでなく、ユーザーのニーズや状況を推定し積極的に情報やサービスを提供する機会を創出する``能動的な対話サービス''もユーザの秘めたる欲求に対するサービス提供の機会を掘り起こすうえで重要である。能動的なサービス対話の1つの難しさは、その発話タイミングの決定である。ユーザーの活動を観察し、妨げず、気分を害さないことが望ましい。本研究では、対話中における能動的発話を含む発話タイミングを推定するモデルを構築することを目的とした。そのために、対話中という状況とその中における適切な発話タイミングについて考察し、それに基づいて推定モデルを作成し評価した。全体の精度は8割強の数字を示したが、能動的な発話のタイミングの精度は低く、検討すべき課題が明らかとなった。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/3R5-OS-13c-04/advanced

--------------------------------------------

テーマ:
大規模言語モデルとシソーラスを融合した特許文書を対象とする検索クエリ拡張

日時:
5月31日(金)10:20~10:40

発表者:
〇森 楓1,2、野中 尋史3、邊土名 朝飛4、河野 誠也5、吉野 幸一郎5、丸崎 恒司1、片岡 翔太郎1,6
 (1. 長岡技術科学大学、2. 株式会社キカガク、3. 愛知工業大学、4. 株式会社サイバーエージェント、5. 理化学研究所ガーディアンロボットプロジェクト、6. 株式会社マヨラボ)

概要:
特許検索とは、特許データベース内に存在する技術や発明。発明者、及び申請者に関するデータを調査するプロセスを指す。特に、特許侵害が裁判で認められれば、高額の賠償金やライセンス料を求められる可能性があるため、先行技術調査が重要である。ただし、特許文書は独自の語彙で構成され、かつ文書数が膨大なため、調査には膨大なコストがかかる。網羅的な検索を目指し、検索クエリを拡張する手法等がいくつか存在するが、総じて少数の特許にのみ存在する複雑な語彙に対応できない課題を抱えている。そこで本研究では、シソーラスと大規模言語モデル(LLM)を組み合わせたクエリ拡張を提案する。本研究ではLLMの出力傾向や既存のシソーラスとLLMによって生成される新たな単語の独立性や共起率に焦点を当て、手法に関する基礎的な分析を行った。結果として、大規模言語モデルで生成された新たな単語は、既存のシソーラスとの共起度が低かった。大規模言語モデルにより新たな語彙の生成に成功し、特許文書の独自の語彙や複雑な表現に対応した網羅性の高い特許検索が実現できる可能性が示唆された。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/4A1-GS-6-05/advanced


■企画セッションについて

テーマ:
機械学習が紡ぐゲーム理論のフロンティア

日時:
5月29日(水)13:30 ~ 15:10

企画オーガナイザ:
阿部 拳之(株式会社サイバーエージェント)岩崎 敦( 電気通信大学)

概要:
近年、ゲーム理論と機械学習分野の技術が相互に応用される取り組みが活発になっています。本セッションでは、「ゲーム理論とオンライン学習」、「ゲーム理論と最適輸送」という2つのテーマに焦点を当て、それぞれの紹介をチュートリアル形式で行います。1つ目の講演では、ゲームのナッシュ均衡解を効率的に近似するアルゴリズムを、大規模言語モデル学習などの最適化問題に応用する取り組みについて解説します。2つ目の講演では、最適輸送をはじめとする機械学習技術が、オークションの自動設計やマッチングの実証研究にどのように適用するかを具体的に紹介します。これらのテーマを通じて、2つの分野がどのように融合し、新たな可能性を創出しているかを理解することを目指します。

URL
https://confit.atlas.jp/guide/event/jsai2024/subject/2J4-KS-1-01/advanced

--------------------------------------------

テーマ:
人工知能学会の多様性と包摂の推進の取り組みと展開

日時:
5月31日(金)09:00 ~ 10:40

企画オーガナイザ:
高野 雅典(株式会社サイバーエージェント)、荒井 ひろみ(理化学研究所)、清田 陽司(株式会社LIFULL)、斎藤 明日美(株式会社コーピー)、長倉 克枝(中央大学)

概要:
人工知能学会 多様性・包摂推進委員会は「多様な社会的背景・属性の研究者・学生がそれらに起因するハードルなく自由に人工知能研究・学習に邁進できる環境の整備および研究者・学生の支援」を目的として2023年に設立されました。人工知能関連技術の社会的影響力は年々高まっており、多様な人々が自由に研究・技術にアクセスできる環境の実現は社会的にも学会としても重要です。本セッションでは当委員会のこれまでの取り組み・当学会の会員参加者の動向を紹介し、パネリスト・会場参加者(オンサイト/オンライン)で多様性と包摂の推進について議論します。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/4J1-KS-4-01/advanced


■ポスターセッションについて

テーマ:
『IDOLY PRIDE』におけるアイドル埋め込みを用いたユニット編成最適化

日時:
5月30日(木) 11:00 ~ 12:40

発表者:
〇伊原 滉也1、田村 和範2、叶 穎睿1、野村 将寛1
 (1. 株式会社サイバーエージェント、2. 株式会社QualiArts)

概要:
マネージャーとしてアイドルを育成するスマートフォンRPG『IDOLY PRIDE』において、最も重要なゲームパートにライブのユニット編成がある。最適なユニット編成を見つけることは、新規アイドル実装時の影響を事前に調査しゲームバランスを調整するために重要な課題である。本研究では、多様なアイドルの中からユニットに配置するアイドルを選択するユニット編成を、アイドルを変数とした組合せ最適化問題として定式化する。この問題の効率的な最適化のため、我々は新たな遺伝的アルゴリズム(GA)を開発する。アイドルに関する事前知識を活用した最適化を行うため、それらの情報を埋め込んだアイドル表現を開発し、それに基づいた突然変異オペレータを提案する。『IDOLY PRIDE』のハイスコアライブにおけるシミュレーション実験により、ユニット編成最適化へのGA適用の有効性と提案手法による探索性能の改善を確認した。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/3Xin2-73/advanced

--------------------------------------------

テーマ:
ライブ配信コンテンツにおける発話の定量評価

日時:
5月30日(木) 11:00 ~ 12:40

発表者:
〇中村 優太1、武内 慎1
(1. 株式会社サイバーエージェント)

概要:
ライブ配信プラットフォームは、Consumer Generated Media (CGM)の新しい形態であり、近年ビジネス的にも学術的にも注目されている。ライブ配信に関する先行研究として、参加者がライブ配信を見る理由や、配信者がどうコミュニケーションすべきかを調べた研究が存在する。しかしこれらは主にゲーム配信プラットフォームに限定され、またアンケートデータを用いており配信者とリスナーの個々のコミュニケーションには焦点を当てられていない。本研究では、日本の音楽ストリーミングサービス「AWA」が提供する音声ライブ配信環境「ラウンジ」の配信データを用いて、配信者の各発話を定量的に評価する方法を検証した。具体的には、inaSpeachSegmenterを用いて発話を区切り、OpenSMILEにより発話の音声特徴量を抽出した。そして、その発話が誘発する参加者のチャット応答を予測するモデルを、LightGBMを用いて構築した。本研究はライブ配信の配信者とリスナーのコミュニケーションの理解に貢献する。また実務観点でも、得られたライブ配信コンテンツの特徴量のレコメンド活用等の応用が考えられる。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/3Xin2-13/advanced

--------------------------------------------

テーマ:
セールストークを対象とするエンゲージメントを考慮した目標指向対話データセット

日時:
5月30日(木) 11:00 ~ 12:40

発表者:
〇邊土名 朝飛1、馬場 惇1、赤間 怜奈2 (1. サイバーエージェント、2. 東北大学)

概要:
本研究では、対話継続意欲、情報提供意欲、目標受容意欲の3種類のユーザーエンゲージメントを考慮しつつ対話目標を達成する対話タスクとして Engagement-motivated Goal-Oriented Dialogue (EGOD)を提案する。さらに、EGODシステムを実現に向けて、商品販売を対象としたセールスEGODデータセットを構築し、データセットの分析を行った。収集した98対話のうち、購買意欲が向上した対話は半数以上の58件を占めており、高品質なセールストークが収集できたと考えられる。データセットの分析の結果、対話目標である購買意欲向上のためには、エンゲージメントを向上させる発話を行うよりも、エンゲージメントを低下させる発話を避けることが重要であることが示唆された。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/3Xin2-40/advanced

--------------------------------------------

テーマ:
ダブルマシンラーニングによるECサイト広告データの分析

日時:
5月31日(金) 12:00 ~ 13:40

発表者:
〇鈴木 悠悟1,2、森村 哲郎2、岡 達志3,2
 (1. 横浜市立大学、2. 株式会社サイバーエージェント、3. 慶應義塾大学)

概要:
インターネットを介して商品やサービスを販売するウェブサイトである電子商取引(Electronic Commerce、 EC)サイトにおいて、広告は売上促進のための主要な手段として活用されている。そのため広告の効果を推定し、広告戦略を評価することが重要である。しかし、売上は季節性・市場動向・消費者の行動パターンなど、様々な要因によって変動するため、広告効果や広告運用の評価は容易ではない。特に、単に売上を予測するだけでなく、広告がどのように売上に影響を及ぼすかを明らかにするためには、予測モデリングだけではなく因果推論の考え方が必要になる。本研究では、ダブルマシンラーニング(DML)という機械学習と因果推論を組み合わせたアプローチを採用して、EC サイトの購買データを分析し、広告効果と広告運用の評価を行う。さらにデータの特性を考慮した潜在変数を取り入れたDML を提案し、その効果を検証する。分析結果から、広告効果の推定においてDMLが潜在的な売上効果を推定できるということ、データが少ない場合では潜在変数を考慮したDMLにより正しい効果を推定できることが示唆された。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/4Xin2-05/advanced

--------------------------------------------

テーマ:
悲観的なRLHF

日時:
5月31日(金) 12:00 ~ 13:40

発表者:
〇森村 哲郎1、坂本 充生1
 (1. 株式会社サイバーエージェント)

概要:
大規模言語モデル(LLM)のファインチューニングには、人間のフィードバックからの強化学習(RLHF)が広く用いられている。しかし、RLHFでは報酬モデルの学習を行うが、一般に推定誤差が残るため、報酬モデルへの過剰適応が問題になる。これはRLHFの適用を困難にする要因となっている。本研究では、この問題に対処するため、多様な報酬モデルを複数作成し、報酬の評価を悲観的に行うアプローチを提案する。具体的には、報酬モデル間の出力のばらつきから報酬計算の確信度を評価し、確信度が低いときには悲観的に報酬を評価する。アプローチの有効性を実験的に検証する。

URL:
https://confit.atlas.jp/guide/event/jsai2024/subject/4Xin2-13/advanced