Encoder型確率モデルへの情報理論を用いた学習理論の展開
| 体系的番号 |
JPMJBY24G8 |
研究代表者 |
二見 太 東京大学, 大学院新領域創成科学研究科 複雑理工学専攻, 講師
|
| 研究期間 (年度) |
2025 – 2030 (予定)
|
| 概要 | 深層学習を用いて高次元データを低次元へと圧縮するEncoder型確率モデルが様々な分野で活用されています。その学習時には圧縮で得られた表現について正則化を行うことが多いですが、既存の理論はそうした正則化がなぜ有効なのか説明できません。本研究は情報理論とPACベイズ理論の融合により、新たなアルゴリズム依存型学習理論を構築しその有効性を明らかにします。更に理論をもとにした新たな変分ベイズや圧縮手法の提案を行います。
|