体系的番号 |
JPMJAX24CK |
研究代表者 |
西川 直輝 東京大学, 大学院情報理工学系研究科, 大学院生
|
研究期間 (年度) |
2024 – 2026
|
概要 | 深層基盤モデルのスタンダードとして活躍するTransformerは、注意機構と呼ばれる計算量が大きい手法に依存しています。省コストな代替手法が数多く提案されていますが、それらの能力は注意機構には及びません。本研究では、注意機構と代替手法の能力を統計理論に基づいて解明します。注意機構を代替手法で置き換えても性能が落ちない状況を明らかにすることで、効率的かつ高性能なネットワークの設計を目指します。
|
研究領域 | 次世代AIを築く数理・情報科学の革新 |