このページの本文へ移動

Menu

メニュー

  • 企業 
  • ニュース 
  • サービス 
  • 技術・クリエイティブ 
  • 採用 
  • 投資家情報 
  • サステナビリティ 
  • CyberAgent Way 

 

登壇

第98回人工知能セミナーに、AI Lab研究員の陣内 佑が登壇いたします。

人工知能学会が主催する「第98回人工知能セミナー」が2025年7月11日(金)に開催されます。本セミナーでは、AI Lab研究員の陣内 佑が「大規模言語モデルのための強化学習」をテーマに登壇します。

イベント概要

「第98回人工知能セミナー」は、人工知能学会が毎月開催する講演シリーズです。最新AIトレンドや技術動向を、専門家から「短時間で分かりやすく」学べる場として、気軽にご参加いただきながら、「いま知りたい」AIの最新動向を把握できるイベントです。

登壇概要

日時:2025年7月11日(金)17:00~19:30

会場:オンライン(Zoomウェビナー)

テーマ:「大規模言語モデルのための強化学習」

登壇者:AI Lab研究員 陣内 佑

URL:https://www.ai-gakkai.or.jp/event/ai-seminar/no98_jsai_seminar/

発表概要

本講演では、基礎編と実践編に分けて大規模言語モデル(LLM)における強化学習、Reinforcement Learning from Human Feedback(RLHF)について解説します。

基礎編

GPT-1からGPT-4までのLLM開発史を振り返り、事前学習、SFT(教師あり学習)、RLHFについて解説します。また、DeepSeekで採用されているGRPO手法や未解決課題にも触れます。

実践編

trlライブラリを活用した実装方法を紹介し、市販GPU(VRAM 16GB程度)での実験、学習効率化の工夫、よくある失敗例と対処法について詳しく説明します。

登壇者略歴

2023年に株式会社サイバーエージェント AI事業本部の研究開発組織AI Labに入社。専門分野は強化学習、プランニング、探索アルゴリズムです。

個人HP: https://jinnaiyuu.github.io/