麻省理工学院(MIT)的工程师们正试图让机器人变得足够聪明,能够与人类有效地合作。他们认为关键在于交叉训练。

“人们不是机器人;他们没有每一次的方式做的事情,“电脑科学和人工智能实验室(CSAIL)的互动机器人集团的航空航天助理教授Julie Shah说。“所以,在我们的方式之间存在一个不匹配的机器人,以便每次以完全相同的方式执行任务以及我们需要他们的任务,如果他们要与人们一起工作。”

Shah和她的同事一直在研究在训练中展示的技术是否可以应用于人类和机器人的混合团队。一种这种技术称为交叉训练,在给定的日子上看到团队成员互相交换角色。

“这让人们对自己的角色如何影响伴侣,以及伴侣的角色如何影响自己形成了更好的想法,”沙阿说。

为了让机器人参与交叉训练实验,MIT工程师首先要设计一种新的算法,以便允许设备从其角色交换体验中学习。因此,他们修改了现有的加强学习算法,允许机器人不仅可以从积极和负奖励中获取信息,而且还通过示范获得的信息。这样一来,通过观察它们人的相应切换角色来开展工作,机器人能够了解人类如何希望他们执行相同的任务。

然后,每个人-机器人团队在虚拟环境中执行一项模拟任务,其中一半团队使用传统的交互式奖励方法,另一半团队使用交叉训练技术,在会议中途切换角色。一旦这些团队完成了虚拟训练,他们被要求在现实世界中执行任务,但这一次他们坚持自己的指定角色。

Shah和她的同事们发现,在参与交叉训练的团队中,人和机器人同时工作的时间——也就是所谓的并行运动——比互动奖励小组增加了71%。他们还发现,在等待机器人完成任务的某一阶段时,人类无所事事的时间减少了41%。

在实验后响应调查问卷时,人类参与者的交叉培训更有可能说机器人根据他们的偏好进行任务,而不是奖励的群体,并报告了对其机器人的更大程度的信任程度队友。

沙阿认为,团队表现的改善可能是由于双方在交叉训练过程中的更多参与。她解释说:“当人们通过奖励来训练机器人时,它是单向的:人说‘好机器人’,人说‘坏机器人’,这是一条非常单向的信息通道。”“但是,当你转换角色时,人能够更好地适应机器人的能力,并了解它可能做什么,因此我们认为,在人方面的适应会导致更好的团队表现。”