構造を持つデータの学習可能性解析による巨大深層モデルの理解
体系的番号 |
JPMJAX23C4 |
DOI |
https://doi.org/10.52926/JPMJAX23C4 |
研究代表者 |
大古 一聡 東京大学, 大学院情報理工学系研究科, 大学院生
|
研究期間 (年度) |
2023 – 2025
|
概要 | 現実世界のデータを低次元性と局所的な複雑性とを併せ持つものと定式化し、ニューラルネットがそれらを効率的に学習できることを最適化理論と統計理論を両立して示します。この理論を巨大深層モデルの解析に用い、事前学習での最適化から下流タスクの推論までを統一的に議論します。巨大深層モデルの成功の背後にある要素を明らかにし、モデル圧縮やデータセット構成といった実用手法への還元を目指します。
|
研究領域 | 次世代AIを築く数理・情報科学の革新 |