离线学习

编辑
本词条由“匿名用户” 建档。

在机器学习中,采用离线学习的系统在初始训练阶段完成后不改变其对目标函数的逼近。这些系统也是典型的急切学习的例子。在在线学习中,只有可能的元素集合是已知的,而在离线学习中,学习者知道元素的身份以及它们被呈现的顺序。机器人控制的应用机器人的学习能力等于创建一个表(信息),该表充满了价值。这样做的一个选择是通过演示编程。在这里,表格是由人类教师填写数值的。示范是以直接数字控制策略的形式提供的,这相当于一...

目录

离线学习

编辑

机器学习中,采用离线学习系统在初始训练阶段完成后不改变其对目标函数的逼近。这些系统也是典型的急切学习的例子。在在线学习中,只有可能的元素集合是已知的,而在离线学习中,学习者知道元素的身份以及它们被呈现的顺序。机器人控制的应用机器人的学习能力等于创建一个表(信息),该表充满了价值。这样做的一个选择是通过演示编程。在这里,表格是由人类教师填写数值的。示范是以直接数字控制策略的形式提供的,这相当于一个轨迹,或者是预先给出的间接目标函数。离线学习是以批处理模式工作的。在步骤1中,任务被演示并存储在表中,而在步骤2中,任务被机器人复制。

离线学习

由于行为演示和技能重放之间存在延迟,该管道是缓慢和低效的。一个简短的例子将有助于理解这个想法。假设机器人要学习一项跟墙任务,而机器人的内部表格是空的。在机器人在重放模式下被激活之前,人类演示者必须教授这个行为。他用远程操作控制机器人,在学习步骤中生成技能表。这个过程被称为离线,因为机器人控制软件没有做任何事情,但设备被人类操作者用作沿墙行驶的指向性设备。

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/175865/

(1)
词条目录
  1. 离线学习

轻触这里

关闭目录

目录