Google Research和加州大学伯克利分校的研究人员最近开发了一种模仿学习系统,可以在机器人中实现各种敏捷的运动行为。他们的技术发表在arXiv上的一篇论文中,该技术使机器人可以通过模仿动物来获得新技能。
进行这项研究的研究人员之一贾森·彭(Jason Peng)对TechXplore表示:“该项目建立在计算机图形学的一些先前作品的基础上,该图形学通过模仿人体运动捕捉数据来训练模拟角色进行移动。” “这些技术大多数主要用于仿真,但是在我们最近的项目中,我们迈出了将其应用于真实机器人的第一步。”
Peng和他的同事最初训练了四足机器人,以模仿狗在模拟环境中的运动和行走方式。他们的系统使用称为强化学习的方法接受了从真实狗身上记录的运动数据的训练。
Peng解释说:“模拟训练的优点之一是它非常快,因此我们可以在几天之内模拟数月的训练。” “一旦对机器人进行了模拟训练,我们就可以使用在现实世界中收集到的几分钟数据,将其学到的东西应用于真正的机器人。”
Peng和他的同事采用的模仿学习方法比设计机器人控制器的传统技术更具扩展性。实际上,与其为一个机器人试图复制的每种技能设计一种新的控制器,他们的方法还可以通过向动物展示一些动物执行期望动作的示例,简单地训练机器人以实现特定的运动风格。然后,机器人只需观察这些示例即可自动学习新的运动技能。
Peng和他的同事在一系列实验中评估了他们的方法,训练了18自由度四足机器人Laikago,以重现不同的动物运动行为,包括不同的奔跑,跳跃和转弯方式。值得注意的是,他们的技术使机器人可以自动合成各种动物运动风格的控制器,从而将在模拟环境中学习到的技能有效地转移到现实世界中。
“对我们来说,最令人兴奋的结果是,相同的基础方法可以学习从步行到动态跳跃和转弯的各种技能,并且在模拟中学习的所有技能也可以转移到真正的机器人上,” Peng说。“这些模仿学习技术可以使为机器人建立大量技能库变得更加容易,从而使它们能够与现实世界更加灵活地移动和交互。”
将来,Peng和他的同事开发的模仿学习系统可以在受动物启发的机器人中实现更多种类的敏捷动作。目前,他们的技术只能使用运动数据进行训练,但研究人员正在尝试进一步开发它,以便它也可以从动物视频中学习。
Peng说:“我们现在有兴趣尝试让机器人模仿不同种类的运动数据,例如视频剪辑。” “运动捕捉数据有时可能很难记录,尤其是从动物身上记录下来,因为把狗带入Mocap工作室可能很棘手。如果我们只用手机记录一些我们想要的机器人的视频片段,那就太好了。然后让机器人学习如何自动重现这些技能。”