インタラクティブ強化学習に基づく人間参加型適応的テキスト音声合成
体系的番号 |
JPMJAX23CB |
DOI |
https://doi.org/10.52926/JPMJAX23CB |
研究代表者 |
齋藤 佑樹 東京大学, 大学院情報理工学系研究科, 助教
|
研究期間 (年度) |
2023 – 2025
|
概要 | 深層学習に基づくテキスト音声合成(TTS)技術は、データ駆動で多様な音声を学習・合成できる一方で、一度の学習で得られた知識の範疇外の発話スタイルは再現できません。本研究では、(1)インタラクティブ強化学習に基づくTTSモデル学習アルゴリズムの開発と、(2)人間参加型の大規模方言TTS学習への応用展開により、人間との相互作用を通じて発話スタイルの適応・追加学習が可能なTTS技術を実現します。
|
研究領域 | 次世代AIを築く数理・情報科学の革新 |