1. 前のページに戻る

構造を持つデータの学習可能性解析による巨大深層モデルの理解

研究課題

戦略的な研究開発の推進 戦略的創造研究推進事業 ACT-X

体系的番号 JPMJAX23C4
DOI https://doi.org/10.52926/JPMJAX23C4

研究代表者

大古 一聡  東京大学, 大学院情報理工学系研究科, 大学院生

研究期間 (年度) 2023 – 2025
概要現実世界のデータを低次元性と局所的な複雑性とを併せ持つものと定式化し、ニューラルネットがそれらを効率的に学習できることを最適化理論と統計理論を両立して示します。この理論を巨大深層モデルの解析に用い、事前学習での最適化から下流タスクの推論までを統一的に議論します。巨大深層モデルの成功の背後にある要素を明らかにし、モデル圧縮やデータセット構成といった実用手法への還元を目指します。
研究領域次世代AIを築く数理・情報科学の革新

報告書

(1件)
  • 2023 年次報告書 ( PDF )

URL: 

JSTプロジェクトデータベース掲載開始日: 2023-12-27   JSTプロジェクトデータベース最終更新日: 2025-07-16  

サービス概要 よくある質問 利用規約

Powered by NII jst