構造的音韻論に基づく話者不変な音声の表現学習モデルの構築

研究課題

体系的番号	JPMJAX25C7
研究代表者	恩田健太郎東京大学, 大学院工学系研究科, 大学院生
研究期間 (年度)	2025 – 2027
概要	音素は物理的特徴ではなく、相互の関係性に基づく表現だとする構造的音韻論によれば、我々人間が話者によらず音声の意味を理解できるのは、発話を全体の構造として認識しているためだと言えます。本研究では、構造的音韻論の技術的実装である「構造的表象」を再訪し、話者不変の特徴量を抽出可能な音声の自己教師あり学習モデルの構築に挑戦します。本研究は、人間の認知に近い音声言語処理の実現に貢献することが期待されます。
研究領域	次世代AIを築く数理・情報科学の革新