言語表現の階層構造に基づくEnd-to-End音声認識の研究

研究課題

体系的番号	JPMJAX210J
DOI	https://doi.org/10.52926/JPMJAX210J
研究代表者	樋口陽祐早稲田大学, 大学院基幹理工学研究科, 大学院生（博士課程）
研究期間 (年度)	2021 – 2023
概要	End-to-End音声認識とは、音声からテキストへのダイレクトな変換を深層学習により実現する手法です。本研究では、テキスト情報が有する「文字」や「単語」といった言語の構成単位に着目し、言語表現を階層的に組み上げる音声認識モデルを構築することで、認識精度のさらなる向上を目指します。本研究により、音声から言語理解に有用な特徴の抽出が可能となり、音声対話といった音声理解システムへの応用が期待できます。
研究領域	数理・情報のフロンティア

報告書

(4件)