深度强化学习
编辑深度强化学习是机器学习的一个子领域,结合了强化学习(RL)和深度学习。强化学习考虑的是一个计算代理学习通过试验和错误做出决定的问题。深度RL将深度学习纳入解决方案,允许代理从非结构化的输入数据中做出决定,而不需要对状态空间进行人工设计。深度RL算法能够接受非常大的输入,并决定执行什么行动来优化目标(例如,最大化游戏分数)。
深度强化学习的概述
编辑深度学习
深度学习是机器学习的一种形式,利用神经网络将一组输入通过人工神经网络转化为一组输出。深度学习方法,通常使用有标签的数据集进行监督学习,已被证明可以解决涉及处理复杂的高维原始输入数据(如图像)的任务,与之前的方法相比,人工特征工程更少,使包括计算机视觉和自然语言处理在内的几个领域取得重大进展。
强化学习
编辑强化学习是一个过程,在这个过程中,xxx通过试验和错误来学习做决定。在强化学习中(相对于最优控制而言),算法仅能获得动态的信息的状态s是高维的(例如,来自相机的图像或来自机器人的原始传感器流),无法用传统的RL算法来解决。深度强化学习算法结合深度学习来解决这样的地图a,通常代表政策或其他学习函数作为一个神经网络,并开发出在这种情况下表现良好的专门算法。
深度强化学习的历史
编辑伴随着20世纪80年代中期开始对神经网络兴趣的上升,人们对深度强化学习的兴趣也在增长,在强化学习中使用神经网络来表示策略或价值函数。因为在这样的系统中,机器人或代理中从传感器到电机的整个决策过程都涉及一个神经网络,所以有时也被称为端到端强化学习。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/176843/