インタラクティブ強化学習に基づく人間参加型適応的テキスト音声合成

研究課題

体系的番号	JPMJAX23CB
DOI	https://doi.org/10.52926/JPMJAX23CB
研究代表者	齋藤佑樹東京大学, 大学院情報理工学系研究科, 助教
研究期間 (年度)	2023 – 2025
概要	深層学習に基づくテキスト音声合成(TTS)技術は、データ駆動で多様な音声を学習・合成できる一方で、一度の学習で得られた知識の範疇外の発話スタイルは再現できません。本研究では、(1)インタラクティブ強化学習に基づくTTSモデル学習アルゴリズムの開発と、(2)人間参加型の大規模方言TTS学習への応用展開により、人間との相互作用を通じて発話スタイルの適応・追加学習が可能なTTS技術を実現します。
研究領域	次世代AIを築く数理・情報科学の革新

報告書

(1件)