介绍强化学习的基础知识,包括强化学习的基本概念、马尔可夫模型和动态规划期望方程等,分析讨论策略迭代、价值迭代、时序差分学习和Q学习等传统强化学习方法;
系统地介绍和讨论基于价值的深度强化学习方法和基于策略的深度强化学习方法;
梳理总结强化学习和深度强化学习的基本知识框架、基本学术流派以及未来发展趋势;
深度强化学习应用开发的基本知识和技术要点。
“矿业课堂”定位于矿业行业职业发展学习平台,为矿业、能源行业在职人员提供前沿、系统化的专业技能、行业法规、管理方法培训和咨询服务。依托良好的行业资源,“矿业课堂”与多所矿业高校、科研院所和矿业龙头高科...
擅长领域: