音声入力による音声ドキュメントの高速・高精度なターム検索手法の開発

研究課題

研究責任者	中川聖一豊橋技術科学大学, 工学(系)研究科(研究院), 教授
研究期間 (年度)	2012 – 2013
概要	講義音声や講演音声、放送コンテンツ、コールセンターの収録音、インターネット上のポッドキャストなど膨大な音声データ(音声ドキュメントと呼ぶ)が蓄積されている。このような音声データから、所望のキーワードを含む音声区間を高速に検索することが望まれている。従来の研究は、これらのキーワードをキーボード等のテキストで入力するのが一般的であった。本研究開発では、キーワードを音声で入力する手法を開発した。高速に検索するためには、音声データを音声認識装置で一旦音節列等の文字列に変換語、文字列同士のDPマッチング法を適用するのが一般的であるが、時間処理量が大きい問題があった。本研究開発では、音声認識誤りを考慮した音節単位のトライグラムのインデックス化により、DPマッチングの性能を上回り、かつ16倍高速な検索法を開発した。