强化学习基础篇[3]:DQN、Actor-Critic详细讲解
标签: 强化学习基础篇[3]:DQN、Actor-Critic详细讲解 深度学习博客 51CTO博客
2023-06-04 18:24:27 190浏览
强化学习基础篇[3]:DQN、Actor-Critic详细讲解,强化学习基础篇[3]:DQN、Actor-Critic详细讲解1.DQN详解1.1DQN网络概述及其创新点在之前的内容中,我们讲解了Q-learning和Sarsa算法。在这两个算法中,需要用一个Q表格来记录不同状态动作对应的价值,即一个大小为$[状态个数,动作个数]$的二维数组。在一些简单的强化学习环境中,比如迷宫游戏中(图1a),迷宫大小为4*4,因此该游戏存在16个state;而
好博客就要一起分享哦!分享海报
此处可发布评论
评论(0)展开评论
暂无评论,快来写一下吧
展开评论
您可能感兴趣的博客
