このページの本文へ移動

Menu

メニュー

  • 企業 
  • ニュース 
  • サービス 
  • 技術・クリエイティブ 
  • 採用 
  • 投資家情報 
  • サステナビリティ 
  • CyberAgent Way 

 

登壇

日本音響学会第152回(2024年秋季)研究発表会にて2件の発表をします

9月4日(水)-6日(金)に関西大学 千里山キャンパスにて開催の日本音響学会第152回(2024年秋季)研究発表会で、AI Labから2件の研究発表を行います。
賛助会員ポスター展示にてAI Labの組織紹介、音声情報処理の研究開発事例の紹介をいたしますので、ご興味のある方はぜひお越しください。
 

■日本音響学会について

日本音響学会は、米国音響学会に次いで1936年に設立された、音響関係では世界で2番目の歴史をもつ学会です。研究委員会は、音声、聴覚、騒音・振動、建築音響、電気音響、音楽音響、超音波、アコースティックイメージング、音声コミュニケーションの9分野に分かれて組織され、月例の研究会などのほか、公開セミナーやシンポジウムや春と秋の年2回の研究発表会を開催しています。

 

【発表】

日時 9月4(水) 13:00~13:15[音源分離・強調2] 第11会場  第4学舎4号館3階4301教室
タイトル 基底自動分配のための正則化を用いた非負値テンソル因子分解によるスポットフォーミング 
講演者 綾野 翔馬 氏 (香川高専)、李 莉関 翔悟 (AI Lab Audioチーム リサーチサイエンティスト)、北村 大地 氏(香川高専)
概要 観測信号から特定の音源を抽出する目的音源抽出では、複数のマイクロホンアレイを用いて特定領域の音源を抽出するスポットフォーミングが提案されています。我々はこれまでに非負値テンソル因子分解(NTF)を用いたスポットフォーミングを提案していますが、NTFの基底ベクトルを目的音源成分と干渉音源成分へ振り分ける分配行列の推定が課題でした。本研究では、分配行列をより識別的に誘導する正則化を導入し、基底ベクトルを自動的に振り分ける手法を提案しました。

 

日時 9月5(木) 15:00~17:00 [聴覚/聴覚・音声] ポスター展示会場 第4学舎3号館4階3401教室
タイトル 音声基盤モデルと聴覚モデルを用いた難聴者のための音声了解度予測の検討
講演者 山本 克彦郡山 知樹 (AI Lab Audioチーム リサーチサイエンティスト)
概要 音声の明瞭さを示す音声了解度は、音声評価の分野でとても重要な指標です。難聴者を対象とした音声了解度の予測においても、大規模データで学習された音声基盤モデルベースの手法が高い精度を達成していますが、聴覚特性を考慮した特徴量抽出は行われていません。そこで、本研究では、難聴者の聴覚特性を反映可能な聴覚モデルを用いた分析で得られる特徴量を先行研究のモデルに組み合わせ、予測性能の改善を検討した取り組み内容について発表します。

 

【賛助会員ポスター展示】

日時 9月4(水) 13:00 - 15:00 第4学舎3号館4階3401教室 1-Q-51
内容 音声情報処理に関するAI Labの取り組みや、採用情報など紹介する予定です。
 

 

<関連リンク>

日本音響学会 公式サイト:https://acoustics.jp/
日本音響学会第152回(2024年秋季大会) 公式サイト:https://acoustics.jp/annualmeeting/program/
AI Lab 公式サイト:https://cyberagent.ai/ailab/  
AI Lab Audioチームサイト:https://research.cyberagent.ai/research/audio/