人工智能研究机构OpenAI在构建通用自学习机器人方面取得了新的里程碑。该机构机器人部门表示,Dactyl是去年研发的第一只人形机器人手,已经学会用一只手解决魔方问题。OpenAI将这一壮举视为机器人配件和自身AI软件灵巧性的飞跃,让Dactyl在面对实际挑战前,能够利用虚拟仿真在虚拟任务中学习新任务。
在展示Dactyl新天赋的视频中,我们可以看到机器人手笨拙而准确地操纵着自己的手,朝着完整的立方体解摸索。这需要几分钟,但Dactyl最终可以解决问题。看到这个动作真的很让人困扰,只是因为这个动作似乎明显比不上人类的动作,而且和人类速记员在几秒钟内解多维数据集时展现出来的炫目速度和原始灵巧相比,显得尤为明显。
然而,对于OpenAI来说,Dactyl的成就让它更接近更广泛的AI和机器人行业所追求的目标:可以执行各种真实任务的机器人,无需经过几个月到几年的实际训练时间,也无需专门编程就可以学会。
“大量的机器人可以非常快速地解开魔方。他们在这里做的和我们在这里做的重要区别是,这些机器人是专门制造的。”OpenAI的研究科学家和机器人负责人彼得韦林德说。“显然,你不能用同样的机器人或同样的方法来执行其他任务。OpenAI的机器人团队有着截然不同的野心。我们正试图建造一个通用机器人。类似于人类和人手可以做很多事情(不仅仅是特定的任务)的事实,我们正在尝试构建更广泛的东西。”
在过去的几年里,Welinder列举了一系列机器人,使得魔方的求解远远超出了人类的手和思维范围。2016年,半导体制造商英飞凌开发了一款专为以超人速度解魔方而设计的机器人,这款机器人只用了不到一秒钟的时间就完成了。这打破了当时人类不到五分之二的世界纪录。两年后,麻省理工学院开发的机器在不到0.4秒的时间内解决了一个立方体。2018年底,日本名为Human Controller的YouTube频道甚至开发出了自己的自解魔方,使用3D打印核心连接可编程伺服电机。
多年来,机器已经能够以超人的速度求解魔方。
换句话说,一个为特定任务而建造并被编程为尽可能高效地执行任务的机器人通常可以造福人类,而魔方求解是软件已经掌握的东西。因此,开发一个解决立方体的机器人,即使是人形机器人,本身也不太好,尤其是以Dactyl的缓慢速度。
然而,OpenAI的Dactyl机器人和为其提供动力的软件在设计和使用上与特殊的立方体解算器有很大不同。正如Welinder所说,OpenAI正在做的机器人工作并不是为了在狭窄的任务中取得优异的成绩,因为它只需要你开发更好的机器人,并对它们进行相应的编程。没有现代人工智能,这是可以做到的。
相反,Dactyl是一种能够像人类一样处理新任务的自学习机器人手。它使用软件进行培训。目前,该软件试图以一种基本的方式复制数百万年的进化,帮助我们从小就本能地学会用手。OpenAI希望有一天能帮助人类开发出我们只能从科幻小说中学习的类人机器人。这个机器人可以在社会上安全运行而不伤害我们,可以在城市街道、工厂车间等混乱的环境中执行各种任务。
为了学会单手解魔方,OpenAI并没有明确写Dactyl来解玩具。互联网上的免费软件可以为你做到这一点。它也选择不编程要执行的单个手部动作,因为它想自己识别这些动作。相反,机器人团队为手的底层软件提供了解决混沌多维数据集的终极目标,并利用现代AI(尤其是基于动机的深度学习品牌,称为强化学习)帮助其自行解决。训练AI智能体的方法和OpenAI开发其世界级Dota 2机器人的方法是一样的。
但是直到最近,训练一个人工智能代理去做一些虚拟的事情(比如玩电脑游戏)比训练它去执行真实的任务要容易得多。这是因为它可以加快在虚拟世界中执行某项任务的训练软件的速度,而得益于数千个高端CPU和超高性能,AI可以在短短几个月内在现实世界中花费数万年的训练时间。强大的图形处理器并行工作。
用物理机器人进行同级训练来完成物理任务是不可行的。这也是为什么OpenAI试图在模拟环境中而不是现实世界中率先采用新的机器人训练方法,而机器人行业几乎没有尝试过这种方法。这样,该软件就可以在许多不同的计算机上以加速的速度同时广泛实践,希望它在开始控制真正的机器人时能保留这一知识。
OPENAI的DACTYL机器人手由AI软件提供动力
由于训练的局限性和明显的安全隐患,如今商业上使用的机器人不再使用AI,而是使用非常具体的指令进行编程。“过去,采用这种方法的方式是你使用非常专业的算法来解决任务,在那里你可以分析机器人并运行它。
环境进行精确建模,” Welinder说。“对于工厂机器人,您拥有非常精确的模型,并且您确切地知道您正在工作的环境。您确切知道它将如何拾取特定部分。”这也是为什么当前的机器人比人类的通用性要差得多的原因。对组装例如汽车或计算机组件的一个特定部分的机器人进行其他操作的机器人进行重新编程需要大量的时间,精力和金钱。提出一个机器人,即使是涉及任何水平的人类敏捷或视觉处理的简单任务,也都没有经过适当的培训,这将导致严重的故障。但是,借助现代AI技术,机器人可以像人类一样建模,以便他们可以使用对世界的直觉理解来完成从开门到煎蛋的一切工作。至少那是梦想。
我们距离这种复杂的水平还差几十年,而且AI社区在软件方面取得的飞跃(例如自动驾驶汽车,机器翻译和图像识别)还没有完全转换为下一代机器人。目前,OpenAI只是试图模仿人体一个部位的复杂性,并使该机器人模拟物更加自然地运转。
这就是Dactyl是仿照人手建模的24关节机器人手的原因,而不是您在工厂中看到的爪形或钳式机器人抓手。对于支持Dactyl来学习如何以人类方式利用所有这些关节的软件,OpenAI在尝试解决物理立方体问题之前,已对其进行了数千年的模拟培训。
“如果您要在现实世界中的机器人上进行训练,那么显然,无论您学到的是什么,都在研究您实际想要在其上部署算法的东西。这样,它就简单得多。但是当今的算法需要大量数据。训练一个现实世界的机器人,做任何复杂的事情,都需要多年的经验。” Welinder说。“即使对于一个人来说,也要花费几年的时间,并且人类拥有数百万年的进化才能拥有学习操作手的能力。”
然而,在仿真中,Welinder说可以像在玩游戏和以AI基准为基准的其他任务一样加速训练。“这需要数千年的时间来训练算法。但这只需要几天时间,因为我们可以并行进行培训。在训练这些算法时,您也不必担心机器人会损坏或伤害某人。”他补充道。但是,过去,研究人员在尝试进行虚拟训练以在物理机器人上工作时遇到了相当大的麻烦。OpenAI表示,它是最早真正看到这方面进展的组织之一。
当给它一个真实的立方体时,Dactyl便将其培训投入使用并自行解决,并且它在从未明确培训过的各种条件下进行了培训。这包括用一只手戴着手套的多维数据集解开,用两只手指将其绑在一起,同时OpenAI成员通过用其他物体戳它并用泡沫和像纸屑一样的纸屑淋洗来不断干扰它。
在通过模拟测试其技能之前,OPENAI使用模拟对DACTYL进行了数千年的培训
“我们发现,在所有这些干扰中,机器人仍然能够成功旋转魔方。但这并没有在训练中得到解决。” Welinder的OpenAI机器人团队负责人Matthias Plappert说。“当我们在物理机器人上尝试此功能时,发现的坚固性令我们感到惊讶。”
这就是为什么OpenAI认为Dactyl的新技能对于机器人硬件和AI培训的发展同等重要。即使是世界上最先进的机器人,例如行业领导者Boston Dynamics开发的类人机器人和类似狗的机器人,也无法自主运行,并且它们需要进行大量特定于任务的编程并需要频繁的人工干预才能执行基本动作。
OpenAI表示,Dactyl是迈向这类机器人的一个很小但至关重要的步骤,这种机器人可能有一天可以执行体力劳动或家务劳动,甚至可以与人类一起工作,而不是在封闭的环境中进行操作,而无需任何明确的程序来控制它们的动作。
在对未来的愿景中,机器人学习新任务并适应不断变化的环境的能力将与AI的灵活性和物理机的健壮性一样重要。“这些方法真的开始证明它们是解决我们所生活的物理世界的所有内在复杂性和混乱性的解决方案,” Plppert说。

