
民間企業の研究組織がどのようなデータで、どのような研究を行っているのか、興味をお持ちの方はぜひ発表にお越しください。
■日本音響学会について
日本音響学会は、米国音響学会に次いで1936年に設立された、音響関係では世界で2番目の歴史をもつ学会です。研究委員会は、音声、聴覚、騒音・振動、建築音響、電気音響、音楽音響、超音波、アコースティックイメージング、音声コミュニケーションの9分野に分かれて組織され、月例の研究会などのほか、公開セミナーやシンポジウムや春と秋の年2回の研究発表会を開催しています。
【ポスター発表】
日時 | 3月17日(月) 12:45~14:45[電気音響(1)] 全学講義棟1号館4階 1-403 教室/1-402 教室 |
タイトル | 制約付き補助関数法による非負値テンソル因子分解を用いたスポットフォーミングの高速化 |
講演者 | ◎綾野 翔馬 氏 (香川高専)、李 莉、関 翔悟 (AI Lab Audioチーム リサーチサイエンティスト)、北村 大地 氏(香川高専) |
概要 | 空間上の特定領域に存在する音源を強調する手法として、非負値テンソル因子分解に基づくスポットフォーミングが提案されています。これまでに、補助関数を用いてパラメータを反復的に更新する最適化アルゴリズムが導出されていますが、パラメータ間のスケール曖昧性によって更新後に正規化する必要があります。本研究では、制約付き補助関数を設計し正規化後のパラメータへ直接更新する計算量の少ない最適化アルゴリズムを導出します。また、ハイパーパラメータを適切に設定することで計算量を削減する最適化アルゴリズムを提案します。 |
日時 | 3月19日(水) 10:00~12:00 [音声A・音声B]全学講義棟1号館4階 1-403 教室/1-402 教室 |
タイトル | 変分オートエンコーダに基づく音声-テキストアライメントの汎用性評価 |
講演者 | 〇郡山 知樹 (AI Lab Audioチーム リサーチサイエンティスト) |
概要 | 音声-テキストアライメントは、音声信号の各時刻に対応するテキストを割り当てるタスクで、音声データベースの構築や音声合成モデル学習の補助的なモジュールに有用です。本研究では提案手法のVAEに基づくアライメントモデルが、様々なデータに対して適用可能であることを明らかにし、またLoRAによるモデル適応の有効性や、音素変換器を用いないテキスト入力の可能性を示しました。 |
【発表】
*博士インターンの成果も含みます。
日時 | 3月18日(火) 16:30~16:45 電気音響[エンハンスメント・方位推定] 第1会場 |
タイトル | 分散マイクロフォンアレイを用いたスポットフォーミングにおける空間フィルタと時間周波数マスクの同時最適化 |
講演者 | ◎関 健太郎(サイバーエージェント/東大)、李 莉、関 翔悟 (AI Lab Audioチーム リサーチサイエンティスト)、山岡 洸瑛 氏 (東大) |
概要 | 複数のマイクロフォンアレイを用いるスポットフォーミングではこれまで、同期した各マイクロフォンアレイにおいて空間フィルタを適用し、非同期なアレイ間の出力から時間周波数(TF)マスクにより共通成分を抽出することで、空間上の特定領域に存在する音源を強調していました。本研究では、ブラインド音声抽出の問題として空間フィルタおよびTFマスクのパラメータ同時推定する手法を提案します。非同期マイクロフォンアレイを用いた実験により、提案法の有効性を示します。 |
日時 | 3月19日(水) 14:15~14:30 聴覚/聴覚・音声[難聴] 第4会場 |
タイトル | 振幅包絡情報と音声基盤モデルを用いた難聴者のための音声了解度予測 |
講演者 | ◎山本 克彦、郡山 知樹(AI Lab Audioチーム リサーチサイエンティスト) |
概要 | 音声了解度は音声の明瞭さを表す評価指標です。難聴者を対象とした補聴器音声の評価においても、音声基盤モデルベースの手法が高い予測性能を示していますが、聴覚特性が反映された音響特徴量は明示的に含まれていません。そこで、本研究では、難聴者の聴覚特性を反映した音響特徴量の追加を検討しました。結果として、聴覚モデルから得られる振幅包絡情報が先行研究の予測性能を改善することを実験的に示しました。 |
<関連リンク>
日本音響学会 公式サイト:https://acoustics.jp/日本音響学会第153回(2025年春季大会) 公式サイト:https://acoustics.jp/annualmeeting/program/
AI Lab 公式サイト:https://cyberagent.ai/ailab/
AI Lab Audioチームサイト:https://research.cyberagent.ai/research/audio/