大規模深層学習モデルの協調的学習のための行列ノルム正則化
| 体系的番号 |
JPMJAX25C1 |
研究代表者 |
石川 智貴 東京科学大学, 情報理工学院, 大学院生
|
| 研究期間 (年度) |
2025 – 2027
|
| 概要 | 大規模深層学習モデルの学習コストは指数的に増大し、単一の研究拠点でモデルを一から学習することが現実的ではなくなっています。ただし複数拠点で独立して学習されたモデルを単に結合すると、知識の干渉による忘却などにより、性能が低下してしまいます。本研究では、行列ノルムに基づく正則化を高速で計算する手法を開発することで、複数の研究拠点が協力して大規模モデルを学習するための協調型の学習基盤を構築します。
|
| 研究領域 | 次世代AIを築く数理・情報科学の革新 |