1. 前のページに戻る

言語表現の階層構造に基づくEnd-to-End音声認識の研究

研究課題

戦略的な研究開発の推進 戦略的創造研究推進事業 ACT-X

体系的番号 JPMJAX210J
DOI https://doi.org/10.52926/JPMJAX210J

研究代表者

樋口 陽祐  早稲田大学, 大学院基幹理工学研究科, 大学院生(博士課程)

研究期間 (年度) 2021 – 2023
概要End-to-End音声認識とは、音声からテキストへのダイレクトな変換を深層学習により実現する手法です。本研究では、テキスト情報が有する「文字」や「単語」といった言語の構成単位に着目し、言語表現を階層的に組み上げる音声認識モデルを構築することで、認識精度のさらなる向上を目指します。本研究により、音声から言語理解に有用な特徴の抽出が可能となり、音声対話といった音声理解システムへの応用が期待できます。
研究領域数理・情報のフロンティア

報告書

(4件)
  • 2023 事後評価書 ( PDF )   終了報告書 ( PDF )
  • 2022 年次報告書 ( PDF )
  • 2021 年次報告書 ( PDF )

URL: 

JSTプロジェクトデータベース掲載開始日: 2022-05-09   JSTプロジェクトデータベース最終更新日: 2025-03-26  

サービス概要 よくある質問 利用規約

Powered by NII jst