音声メディアの合成と品質評価のための深層学習モデルの統合的最適化

研究課題

体系的番号	JPMJBY24C9
研究代表者	齋藤佑樹国立研究開発法人産業技術総合研究所, 人工知能研究センター　知的メディア処理研究チーム, 特定フェロー
研究期間 (年度)	2025 – 2030 (予定)
概要	日々のコミュニケーションの中で、人間は自らの声を柔軟に制御するのみならず、他者の声を何らかの基準に基づいて評価する能力を持っています。本研究では、人間が持つこの能力をAIに実装することを目指し、音声合成・品質評価の深層学習モデルのための大規模データセット構築と統合的最適化のための学習アルゴリズム開発を推進します。