
イベント概要
「第98回人工知能セミナー」は、人工知能学会が毎月開催する講演シリーズです。最新AIトレンドや技術動向を、専門家から「短時間で分かりやすく」学べる場として、気軽にご参加いただきながら、「いま知りたい」AIの最新動向を把握できるイベントです。
登壇概要
日時:2025年7月11日(金)17:00~19:30
会場:オンライン(Zoomウェビナー)
テーマ:「大規模言語モデルのための強化学習」
登壇者:AI Lab研究員 陣内 佑
URL:https://www.ai-gakkai.or.jp/event/ai-seminar/no98_jsai_seminar/
発表概要
本講演では、基礎編と実践編に分けて大規模言語モデル(LLM)における強化学習、Reinforcement Learning from Human Feedback(RLHF)について解説します。
基礎編
GPT-1からGPT-4までのLLM開発史を振り返り、事前学習、SFT(教師あり学習)、RLHFについて解説します。また、DeepSeekで採用されているGRPO手法や未解決課題にも触れます。
実践編
trlライブラリを活用した実装方法を紹介し、市販GPU(VRAM 16GB程度)での実験、学習効率化の工夫、よくある失敗例と対処法について詳しく説明します。
登壇者略歴
2023年に株式会社サイバーエージェント AI事業本部の研究開発組織AI Labに入社。専門分野は強化学習、プランニング、探索アルゴリズムです。