| 体系的番号 |
JPMJBY24G2 |
研究代表者 |
幡谷 龍一郎 京都大学, 大学院情報学研究科, 特定助教
|
| 研究期間 (年度) |
2025 – 2030 (予定)
|
| 概要 | 現代の生成AIの背後にある大規模基盤モデルの訓練には多量の計算資源が必要となります。訓練済みの基盤モデルは性能を保ったまま大幅な圧縮が可能な一方、圧縮した基盤モデルを訓練すると性能が劣化してしまいます。本研究では、このギャップを乗り越えるために深層モデルを連続化した極限モデルの学習ダイナミクスを利用し、性能を維持しつつ圧縮したままの深層学習の実現を目指します。
|