什么是强化学习强化学习(RL)是一个序列决策问题。例如:撩妹的过程就是一个优化问题。你的每一时刻的行为会对你最终撩妹是否成功,以多大的收益成功都会有影响。那么,你就会考虑,每一步采取什么行为才能(最优)撩妹!这可以看作一个RL问题。你肯定迫不及待的想知道怎么去求解了!action:你的行为state:你观察到的妹子的状态reward:妹子的反应:开心or不开心所以,一个RL的基本模型已经建立。强化学习(reinforcementlearning),又称再励学习、评价学习,是一种重要的机器学习方法,在智...
更新时间:2023-05-08标签: 强学习学习什么强化 全文阅读