未知語と認識誤りに頑健な音声ドキュメントの高速・高精度ターム検索手法の開発
研究責任者 |
中川 聖一 豊橋技術科学大学, 工学(系)研究科(研究院), 教授
|
研究期間 (年度) |
2011
|
概要 | インターネット上には、放送、講演・講義、ポッドキャストなどの大量の音声ドキュメントが蓄積・配信されている。これらには、タイトル等は記載されているが、音声コンテンツの記載はなく、音声波形情報だけであることが多い。このような大量の音声ドキュメントから、所望の語句を含んでいる箇所の音声を高速・高精度に検索することが望まれている。本研究では、大語彙連続音声認識技術と連続音節音声認識技術を併用して、認識誤りや未知語(認識システムの単語辞書に登録されていない単語)に頑健な検索手法を開発した。1000時間の音声に対して、未知語(検索ターム語)を0.5秒以内で、F値で0.6程度の精度で検索することができた。
|