モバイル環境を指向した環境・話者適応型音声認識の実環境性能検証

研究課題

研究責任者	北岡教英名古屋大学, 情報科学研究科, 准教授
研究期間 (年度)	2013
概要	モバイル環境において、周囲環境や使用機材、話者の違いを簡易で高速に吸収して高い音声認識精度を得る手法を検討した。環境や機材などの、不特定多数に共通する音声への複数の影響要因と、話者の違いの要因を区別し、それらの組み合わせとなる特定の環境には各要因への対応を組み合わせることで対処する方法を考案した。具体的には、音声のモデル(音響モデル)の適応のための最尤線形回帰法(MLLR法)の変換行列を、環境ごと、機材ごとに保存し、その組み合わせを行列の積で表現する。この行列で環境適応された音響モデルを話者適応することにより、周囲環境・機材・話者すべてに適応した音響モデルを作成できることを示した。いくつかの環境・機材で収録した音声で実験した結果、その効果を確認した。