您现在的位置是:首页 >学无止境 >【人工智能与深度学习】不确定性下的预测和政策学习(PPUU)网站首页学无止境
【人工智能与深度学习】不确定性下的预测和政策学习(PPUU)
简介【人工智能与深度学习】不确定性下的预测和政策学习(PPUU)
【人工智能与深度学习】不确定性下的预测和政策学习(PPUU)
简介和问题设置
让我们去以一个完全没有强化学习的方式来学习。很多时候,我们训练模型,都是以一个不停犯错同时又由错误中学习的强化学习方式来学习。但这不是最好的方法,因为很容易偏离原先的轨道。
所以,让我们用一些更自认的方式来学习驾驶一辆车。以转弯来说说吧。比如有辆车时速100公里每小时,就是差不
风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。