このページの本文へ移動

Menu

メニュー

  • 企業 
  • ニュース 
  • サービス 
  • 技術・クリエイティブ 
  • 採用 
  • 投資家情報 
  • サステナビリティ 
  • CyberAgent Way 

 

登壇

日本音響学会第155回(2026年春季)研究発表会にて1件の招待講演・2件の発表・1件のパネルディスカッション登壇を行います

2026年3月17日(火),18日(水),19日(木)に日本大学理工学部駿河台キャンパスにて開催の日本音響学会第155回(2026年春季)研究発表会で、AI Labから1件の招待講演・2件の発表・1件のパネルディスカッション登壇を行います。民間企業の研究組織がどのようなデータで、どのような研究を行っているのか、興味をお持ちの方はぜひ発表にお越しください。
 

■日本音響学会について

日本音響学会は、米国音響学会に次いで1936年に設立された、音響関係では世界で2番目の歴史をもつ学会です。研究委員会は、音声、聴覚、騒音・振動、建築音響、電気音響、音楽音響、超音波、アコースティックイメージング、音声コミュニケーションの9分野に分かれて組織され、月例の研究会などのほか、公開セミナーやシンポジウムや春と秋の年2回の研究発表会を開催しています。

 

【招待講演】

日時

3月17日(火) 16:00~16:30 SS[屋外拡声] 第6会場(タワー・スコラ 3階S302教室)

タイトル

受聴側視点の音声明瞭性評価

講演者

山本克彦(AI Lab Audio Insightチーム リサーチサイエンティスト)

概要

[音声品質評価の共通基盤を探る]というスペシャルセッションでの招待講演になります。音声情報の伝達において、音声の明瞭性(音声了解度)を評価することは非常に重要な課題です。評価においては、伝達経路だけでなく受聴者の聴覚特性も考慮する必要があります。そこで本発表では、聴覚特性に基づいた音声分析や音声了解度の自動評価指標について解説します。さらに、近年のスペクトル時間変調分析や、深層学習に基づく自動評価指標の最新動向についても紹介します。

【パネルディスカッション】

日時

3月17日(火) 16:35~17:00 SS[屋外拡声] 第6会場(タワー・スコラ 3階S302教室)

司会

佐藤逸人(神戸大)

登壇者

三上昌也(ユニシー/岩手大)、能勢隆(東北大学/ユニシー)、藤坂洋一(リオン)、浅井拓朗(大成建設)、深美和樹(電気技術開発)、山本克彦(AI Lab Audio Insightチーム リサーチサイエンティスト)

概要

[音声品質評価の共通基盤を探る]というスペシャルセッションでのパネルディスカッションになります。登壇者は、家電等の報知音声、合成音声、室内外の拡声設備、室内音響、補聴器、聴覚と幅広い分野の技術者・研究者になります。本パネルディスカッションでは、音声の発話・生成から受聴までの経路全体を対象とし、現場のニーズも含めた音声品質評価に関する現況の整理と、分野間で共通した枠組みや制度設計の実現可能性について議論を行います。

【発表】

日時

3月17(火) 09:45~10:00 【音声】タワー・スコラ 3階S301教室 1-5-2

タイトル

離散トークンベースの生成的音声強調の信頼度スコアに基づく出力フィルタリング

講演者

山内一輝(サイバーエージェント*/東京大学)、村田雅人関翔悟(AI Lab Audio Insightチーム リサーチサイエンティスト) *リサーチインターンシップでの成果発表

概要

生成的音声強調は、背景雑音や残響などによって劣化した音声を高品質化する技術です。この手法は、音コンテンツのデータキュレーションにも用いられる重要な技術である一方で、特有のハルシネーションを引き起こすリスクがあります。本研究では、モデルの出力する音声の確率分布に基づく信頼度スコアを利用し、ハルシネーションなどの不適切な出力をフィルタリングする手法を提案しました。実験の結果、従来のフィルタリング手法では検知が困難なハルシネーションエラーを、提案手法が効果的に検出できることを示しました。

【ポスター発表】

日時

3月19日(木) 13:00~15:00 [音声] ポスター会場(タワー・スコラ4階 S404)

タイトル

AESCA: AudioMOS Challenge 2025 のための生成音の美的スコア予測システム

講演者

山本克彦宮崎晃一関翔悟(AI Lab Audio Insightチーム リサーチサイエンティスト)

概要

生成音の品質を自動評価する枠組みの構築は、音コンテンツの制作において重要な課題です。昨年開催された国際コンペ「AudioMOS Challenge 2025」では、生成音の美的スコア(audio aesthetics score; AES)を自動評価するタスクが設定されました。そこで、私たちのチームは、Kolmogorov-Arnold Network(KAN)ベースのAudiobox AestheticsとVERSAベース予測器を組み合わせたAESCA (AES prediction system by CyberAgent)を提案しました。また、学習方法としては、教師あり・半教師あり学習を併用するiterative pseudo-labeling(IPL) 戦略を採用しました。結果として、AESCAは本タスクにおいて世界一の予測性能を達成しました。

 


<関連リンク>

日本音響学会 公式サイト:https://acoustics.jp/
日本音響学会第155回(2026年春季大会) 公式サイト:https://acoustics.jp/annualmeeting/program/
AI Lab 公式サイト:https://cyberagent.ai/ailab/  
AI Lab Audioチームサイト:https://research.cyberagent.ai/research/audio/
AI Lab リサーチインターンシップ:https://research.cyberagent.ai/careers/internship/researchinternship/