
「NLP若手の会 第15回シンポジウム(YANS2020)」にて、サイバーエージェントから産学連携の成果を含む5件の発表を行います。
NLP若手の会は、自然言語処理・計算言語学および関連分野の若手研究者/技術者の学問研究や技術開発の促進のため、参加者の相互交流および成長の場を提供しています。研究や技術開発の成果が実社会に応用されることを奨励し、この分野の学問および産業の進歩発展に貢献することを目的として研究シンポジウムを年に1回開催しており、今年はオンラインでの開催となります。
サイバーエージェントからは、二つの産学連携先(東京工業大学・東京都立大学)との共著による発表3件、AI事業本部の発表2件を予定しています。
産学連携先との研究は将来的なプロダクトへの応用を目指しており、実データを使った研究成果を発表します。
また、AI事業本部の発表では、データサイエンティストによるプロダクトの課題解決に向けた取り組みを紹介します。
いずれも今後さらに発展させていく段階の研究ですので、当日はたくさんの方と議論できますと幸いです。
【サイバーエージェント AI事業本部の発表】
タイトル | 対話データからのユーザーの行動予測の検証 |
著者 | ○戸田隆道,友松祐太,杉山雅和(AI Shift) |
発表概要 | AI Shiftではカスタマーサービス向けのチャットボットを提供しており、集まった対話データの 活用として、対話データからのユーザーの行動予測に取り組んでいます。 今回は社内で行った手法検討について共有します。 |
時間 | 10:30-11:10(第1スロット)/13:00-13:40(第3スロット) |
タイトル | BERTを用いたテンプレートベースの広告文自動生成 |
著者 | ○黒田和矢, 平野光聖, 脇本宏平(極予測AIチーム) |
発表概要 | 本研究では、過去に配信された広告文をもとに作られたテンプレートを BERTを用いて穴埋めすることによって、ひとつの商品に対してテンプレートの種類に応じた 多様な広告文を生成することを試みました。 |
時間 | 10:30-11:10(第2スロット)/15:00-15:40(第3スロット) |
【産学連携先との共著による発表】
タイトル | 音声認識誤り検出における文単位ラベルからの単語単位の誤り予測 |
著者 | ○吉村綾馬(都立大),杉山雅和,友松祐太(AI Shift),小町守(都立大) |
発表概要 | 日本語読み上げコーパスから作成した音声認識誤りコーパスを用いて、 文単位ラベルから単語単位の誤り予測を行う音声認識誤り検出を行いました。 また、複数のドメインデータを使用したドメイン適応実験の結果についても発表します。 |
時間 | 10:30-11:10(第4スロット)/13:00-13:40(第1スロット) |
タイトル | マスク言語モデルを用いた対句キャッチコピー生成 |
著者 | ○丹羽彩奈(東工大),西口佳佑(極予測AIチーム),岡崎直観(東工大) |
発表概要 | 本研究では、類似した構造で対照的な意味を持つ句を並列させる「対句」を含む キャッチコピーを生成するため、事前学習済みマスク言語モデルの単語予測確率分布を、 対句の特徴を捉えたものに適応させる手法を提案・検討します。 |
時間 | 10:30-11:10(第2スロット)/15:00-15:40(第3スロット) |
タイトル | 企業情報を考慮した広告文の自動生成 |
著者 | ○昇夏海,平岡達也,丹羽彩奈,岡﨑直観(東工大), 脇本宏平,黒田和矢,西口佳佑(極予測AIチーム) |
発表概要 | 本研究では、既存広告の一部を異なる企業の関連語で置き換えることにより 新たな広告を生成するため、企業情報を利用して事前学習済みマスク言語モデルの出力を コントロールし、企業に関連する単語を予測する手法を提案・検討します。 |
時間 | 10:30-11:10(第2スロット)/13:00-13:40(第4スロット) |