頑健性と安全性の性能限界を明らかにする深層強化学習
体系的番号 |
JPMJPR20C3 |
DOI |
https://doi.org/10.52926/JPMJPR20C3 |
研究代表者 |
小林 泰介 奈良先端科学技術大学院大学, 先端科学技術研究科, 助教
|
研究期間 (年度) |
2020 – 2023
|
概要 | 頑健性と安全性を両立する深層強化学習を開発します。この基盤技術として、頑健性と安全性の定量評価が肝要となります。評価システムの礎として、新しいダイナミクスモデルの学習則と敵対的学習における正則化機構について開発を進め、単体レベルでの理論的・統計的な検証を行います。実問題として人とロボットが物理的接触を図るような実問題を例に検証を進め、理論面・実用面の双方から提案技術を検証します。
|
研究領域 | 信頼されるAIの基盤技術 |