1. 前のページに戻る

統計理論に基づく注意機構の能力解明と効率化

研究課題

戦略的な研究開発の推進 戦略的創造研究推進事業 ACT-X

体系的番号 JPMJAX24CK

研究代表者

西川 直輝  東京大学, 大学院情報理工学系研究科, 大学院生

研究期間 (年度) 2024 – 2026
概要深層基盤モデルのスタンダードとして活躍するTransformerは、注意機構と呼ばれる計算量が大きい手法に依存しています。省コストな代替手法が数多く提案されていますが、それらの能力は注意機構には及びません。本研究では、注意機構と代替手法の能力を統計理論に基づいて解明します。注意機構を代替手法で置き換えても性能が落ちない状況を明らかにすることで、効率的かつ高性能なネットワークの設計を目指します。
研究領域次世代AIを築く数理・情報科学の革新

URL: 

JSTプロジェクトデータベース掲載開始日: 2024-12-19   JSTプロジェクトデータベース最終更新日: 2025-03-26  

サービス概要 よくある質問 利用規約

Powered by NII jst