1. 前のページに戻る

インタラクティブ強化学習に基づく人間参加型適応的テキスト音声合成

研究課題

戦略的な研究開発の推進 戦略的創造研究推進事業 ACT-X

体系的番号 JPMJAX23CB
DOI https://doi.org/10.52926/JPMJAX23CB

研究代表者

齋藤 佑樹  東京大学, 大学院情報理工学系研究科, 助教

研究期間 (年度) 2023 – 2025
概要深層学習に基づくテキスト音声合成(TTS)技術は、データ駆動で多様な音声を学習・合成できる一方で、一度の学習で得られた知識の範疇外の発話スタイルは再現できません。本研究では、(1)インタラクティブ強化学習に基づくTTSモデル学習アルゴリズムの開発と、(2)人間参加型の大規模方言TTS学習への応用展開により、人間との相互作用を通じて発話スタイルの適応・追加学習が可能なTTS技術を実現します。
研究領域次世代AIを築く数理・情報科学の革新

報告書

(1件)
  • 2023 年次報告書 ( PDF )

URL: 

JSTプロジェクトデータベース掲載開始日: 2023-12-27   JSTプロジェクトデータベース最終更新日: 2025-03-26  

サービス概要 よくある質問 利用規約

Powered by NII jst