波士顿动力机器狗学会跳绳!三条狗玩得真欢乐
|
如果出现100种或者1000种不同的情况,还要去执行多项任务,用传统方法去编程是非常难涵盖的,其量级也不可扩展,开发人员不可能 “先知先觉” 预先编程出所有的特定解决方案。因此,这就需要机器人在一个全新的环境下,自主决定应该怎么去做才能完成任务。 其次,机器人遇到新的情况需要随机应变,灵活应付。此前的很多研究中,几乎都是把机器人的单项技能训练做得很好,比如走路、奔跑、故障恢复等,但在演示中,有时候还需要操作员拿着遥控器根据机器人当时所处的情况去切换模式和操作,这让实用性大打折扣。
而本次研究中提出的多专家系统,相当于每个 “专家” 都训练了一种基本技能,比如说走路、故障恢复、摔倒爬起等,单项技能学会之后,然后让不同 “专家” 组队一起训练,通过一个门控神经网络,在不同事件、不同情况下去激活调度每个专家,让他们综合形成不同的协调组合,进而克服不同问题。 通过这样的技能加持,四足机器人 “绝影” 在没有导航的情况下,能自动执行在楼梯、砾石堆、崎岖路面上进行连贯的小跑、转向,乃至在被人踹倒、被推翻的情况下也能迅速恢复正常姿态。 “最后形成的那个综合‘专家’,相当于是集各家之长于一身,懂得融会贯通,这就让机器人具备了在当时那种特定情况下所需要的技能组合,而且能够根据不同情况千变万化、举一反三,去自主恢复继续执行任务。” 李智彬说道。 机器人摸爬滚打的能力有了怎样的提升?请看以下效果:
8项“专家技能”融会贯通,关键恢复能力控制在1秒内 详细来讲,论文中提到的多专家学习体系结构被命名为MELA(multi-expert learning architecture),这是一个由深度神经网络(DNN)和门控神经网络(GNN)组成的分层强化学习(HRL)结构。 为了帮助解释,研究人员定义了几个关键术语:运动技能、专家和运动模式。 (编辑:PHP编程网 - 金华站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |







