このページの本文へ移動

Menu

メニュー

  • 企業 
  • ニュース 
  • サービス 
  • 技術・クリエイティブ 
  • 採用 
  • 投資家情報 
  • サステナビリティ 
  • CyberAgent Way 

 

登壇

日本音響学会第154回(2025年秋季)研究発表会にて3件の発表をします

9月10日(水)-12日(金)に東北工業大学 八木山キャンパスにて開催の日本音響学会第154回(2025年秋季)研究発表会で、AI Labから3件の研究発表を行います。民間企業の研究組織がどのようなデータで、どのような研究を行っているのか、興味をお持ちの方はぜひ発表にお越しください。
 

■日本音響学会について

日本音響学会は、米国音響学会に次いで1936年に設立された、音響関係では世界で2番目の歴史をもつ学会です。研究委員会は、音声、聴覚、騒音・振動、建築音響、電気音響、音楽音響、超音波、アコースティックイメージング、音声コミュニケーションの9分野に分かれて組織され、月例の研究会などのほか、公開セミナーやシンポジウムや春と秋の年2回の研究発表会を開催しています。

 

【発表】

日時 9月10日(月) 10:15~10:30[音声A・音声B]  第1会場
タイトル 音素 BERT と音声基盤モデルを用いた自動韻律アノテーションの検討
講演者 郡山 知樹 (AI Lab Audio Insightチーム リサーチサイエンティスト)
概要 アクセントやイントネーションなどの韻律を制御できる音声合成の実現には、韻律ラベルの付与された音声データベースが必要です。ただし、韻律ラベルの付与は専門知識が必要となり高コストです。本研究では、音声基盤モデルのHuBERTやWhisperだけでなく、言語基盤モデルのPnG BERTやPL-BERTを用いて韻律ラベルの予測モデルを提案し、精度が向上することを示しました。

 

【ポスター発表】

日時 9月10日(水) 13:00~15:00 [聴覚/聴覚・音声]9 号館1階 912 教室
タイトル Mamba を用いた難聴者のための音声了解度予測法の検討
講演者 山本 克彦宮崎 晃一(AI Lab Audio Insightチーム リサーチサイエンティスト)
概要 音声の明瞭性に関する自動評価指標において、Transformerを用いた手法が高い予測精度を達成しています。一方で、Mambaと呼ばれるモデルが、様々な音声タスクにおいてTransformerベースの手法の性能を上回ることが報告されています。本研究では、難聴者の音声了解度の予測タスクにおいて、Mambaの有用性を評価しました。実験の結果、Mambaを用いた手法は、従来手法と同等以上の予測性能を達成しました。
 
日時 9月12日(金) 13:00~15:00 [音声A・音声B(2)]10 号館1階
タイトル Voting に基づく基本周波数推定法の誤差評価 
講演者 小口 純矢、郡山 知樹(AI Lab Audio Insightチーム リサーチサイエンティスト)
概要 音声における韻律制御や音楽のメロディ推定を行う際には、音の高さと概ね対応する物理量である基本周波数がしばしば用いられます。この推定には、複数の推定法の結果を中央値・最頻値によって統合するVoting法が有効であることが経験的に知られていました。本研究は、Voting法の精度向上の理論的背景の考察および、推定法ごとの分析時刻のずれを補正し最適な組合わせを選択するアルゴリズムの提案を行いました。


<関連リンク>

日本音響学会 公式サイト:https://acoustics.jp/
日本音響学会第154回(2025年秋季大会) 公式サイト:https://acoustics.jp/annualmeeting/program/
AI Lab 公式サイト:https://cyberagent.ai/ailab/  
AI Lab Audioチームサイト:https://research.cyberagent.ai/research/audio/