
AI Labに所属する研究員の阿部挙之と、Media Data Tech Labの高野雅典が2022年3月3日(木)~ 5日(土)に開催された「情報処理学会 第84回全国大会 ~変わる社会と情報処理~」にて発表いたしました。
■情報処理学会とは
機関誌やセミナーなどを通じて情報処理分野の知見をお届けするとともに、最新の研究成果を発表する場を提供している学術団体です。
公式サイト
公式サイト
■発表について
・発表者
豊島健太郎,坂本充生(電通大),阿部拳之(サイバーエージェント),岩崎敦(電通大)
・日時
3月3日(木)
・タイトル
クールノー競争におけるマルチエージェント強化学習に関する研究
・概要
本研究では、不完全観測下のクールノー競争におけるマルチエージェント強化学習のダイナミクスを分析した。クールノー競争とは、複占市場で同じ商品の供給量を決めるゲームで、囚人のジレンマの一般化の1つとして知られている。一般に、プレイヤがお互いの行動を見間違う不完全観測下の均衡計算は非常に小規模な問題にしか適応できない。そこで、本研究では複数の強化学習アルゴリズムを用いてダイナミクスの帰結が厳密に均衡を計算する代わりになるかどうかを検証する。また、強化学習の帰結はしばしば複雑になるため、シンプルなレプリケータダイナミクスの帰結とも比較することで、均衡に相当する振る舞いを明らかにする。
—-----------------------------------
・発表者
坂本充生(電通大),阿部拳之(サイバーエージェント),岩崎敦(電通大)
・日時
3月4日(金)
・タイトル
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究
・概要
本研究では、二人零和ゲームにおける突然変異付きレプリケータダイナミクスを利用した学習アルゴリズムの帰結を吟味する。既存アルゴリズムの多くはダイナミクスの時間平均をとって初めて均衡に収束する。しかし、敵対的生成ネットワークなどへの応用では時間平均を取らずに均衡に収束するアルゴリズムの方が望ましい。そこで本研究では、突然変異付きレプリーターダイナミクスに基づく手法 Mutagenic Follow The Regularized Leaderを提案し、実験的に評価した。その結果、このアルゴリズムのダイナミクスが時間平均を取らずに均衡に収束することを示した。
—-----------------------------------
・発表者
横谷謙次(徳島大),高野雅典(サイバーエージェント)
・日時
3月5日(土)
・タイトル
日常的なチャット時間とオンライン・ソーシャル・ネットワーク活動からサイバー違反者とその犯行時間を予測する
・概要
違反者とその犯行時刻を予測することは、グローバルなサイバースペースにおける長年の課題である。本研究では、日常的なチャットの時間やオンラインのソーシャルネットワークを分析することで、この課題を解決する。本研究では、550,000人以上のオンラインユーザーを6ヶ月間にわたってサンプリングした。また、教師なし機械学習と教師あり機械学習を用いて、サイバー違反者とその犯行時間をそれぞれ予測した。日常的なチャットの時間とオンライン・ソーシャル・ネットワークのデータに基づいた我々の予測器は、2ヶ月以内の未来のサイバー違反者を特定した。さらに、1週間以内の犯行時間と犯行日を予測することも出来た。本研究は、日常的なチャットの時間とオンラインのソーシャルネットワークが分かれば、将来のサイバー違反者を予測することができることを示した。我々のサイバー犯罪時間予測器は、将来のサイバー違反を防ぎ、誰にとっても安全なサイバースペースを促進するのに役立つだろう。
豊島健太郎,坂本充生(電通大),阿部拳之(サイバーエージェント),岩崎敦(電通大)
・日時
3月3日(木)
・タイトル
クールノー競争におけるマルチエージェント強化学習に関する研究
・概要
本研究では、不完全観測下のクールノー競争におけるマルチエージェント強化学習のダイナミクスを分析した。クールノー競争とは、複占市場で同じ商品の供給量を決めるゲームで、囚人のジレンマの一般化の1つとして知られている。一般に、プレイヤがお互いの行動を見間違う不完全観測下の均衡計算は非常に小規模な問題にしか適応できない。そこで、本研究では複数の強化学習アルゴリズムを用いてダイナミクスの帰結が厳密に均衡を計算する代わりになるかどうかを検証する。また、強化学習の帰結はしばしば複雑になるため、シンプルなレプリケータダイナミクスの帰結とも比較することで、均衡に相当する振る舞いを明らかにする。
—-----------------------------------
・発表者
坂本充生(電通大),阿部拳之(サイバーエージェント),岩崎敦(電通大)
・日時
3月4日(金)
・タイトル
二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究
・概要
本研究では、二人零和ゲームにおける突然変異付きレプリケータダイナミクスを利用した学習アルゴリズムの帰結を吟味する。既存アルゴリズムの多くはダイナミクスの時間平均をとって初めて均衡に収束する。しかし、敵対的生成ネットワークなどへの応用では時間平均を取らずに均衡に収束するアルゴリズムの方が望ましい。そこで本研究では、突然変異付きレプリーターダイナミクスに基づく手法 Mutagenic Follow The Regularized Leaderを提案し、実験的に評価した。その結果、このアルゴリズムのダイナミクスが時間平均を取らずに均衡に収束することを示した。
—-----------------------------------
・発表者
横谷謙次(徳島大),高野雅典(サイバーエージェント)
・日時
3月5日(土)
・タイトル
日常的なチャット時間とオンライン・ソーシャル・ネットワーク活動からサイバー違反者とその犯行時間を予測する
・概要
違反者とその犯行時刻を予測することは、グローバルなサイバースペースにおける長年の課題である。本研究では、日常的なチャットの時間やオンラインのソーシャルネットワークを分析することで、この課題を解決する。本研究では、550,000人以上のオンラインユーザーを6ヶ月間にわたってサンプリングした。また、教師なし機械学習と教師あり機械学習を用いて、サイバー違反者とその犯行時間をそれぞれ予測した。日常的なチャットの時間とオンライン・ソーシャル・ネットワークのデータに基づいた我々の予測器は、2ヶ月以内の未来のサイバー違反者を特定した。さらに、1週間以内の犯行時間と犯行日を予測することも出来た。本研究は、日常的なチャットの時間とオンラインのソーシャルネットワークが分かれば、将来のサイバー違反者を予測することができることを示した。我々のサイバー犯罪時間予測器は、将来のサイバー違反を防ぎ、誰にとっても安全なサイバースペースを促進するのに役立つだろう。
