编辑:好困
在刚刚结束的NeurIPS上,俞扬团队首次揭示了深度强化学习「记忆池」的最优利用方法。那么,在南京大学人工智能学院做科研又是怎样的一种体验呢?「记忆池」是深度强化学习的基本部件,但多年以来如何最优利用记忆池仍然未知。
在刚刚闭幕的机器学习国际顶级会议NeurIPS上,南京大学人工智能学院独立完成的工作「RegretMinimizationExperienceReplayinOff-PolicyReinforcementLearning」,首次揭示了深度强化学习「记忆池」的最优利用方法。