2019-12-04 10:58

谷歌的DeepMind教人工智能如何在跑酷课程中导航

导读谷歌最初是一家搜索和广告公司,但其幕后的努力已经越来越多地转向机器学习和人工智能。这不仅对搜索有用,而且在无人驾驶汽车、计算机视觉等领域也很有用。这家搜索巨头几年前收购了DeepMind,推动了其人工智能研究的过度发展,现在我们开始看到谷歌产品的好处。来自DeepMind的一个新的研究项目显示,通过教模拟的类人如何在跑酷课程中导航,人工智能可以走多远。 教学机器走路已经证明是棘手的,因为有这么多变

谷歌最初是一家搜索和广告公司,但其幕后的努力已经越来越多地转向机器学习和人工智能。这不仅对搜索有用,而且在无人驾驶汽车、计算机视觉等领域也很有用。这家搜索巨头几年前收购了DeepMind,推动了其人工智能研究的过度发展,现在我们开始看到谷歌产品的好处。来自DeepMind的一个新的研究项目显示,通过教模拟的类人如何在跑酷课程中导航,人工智能可以走多远。

教学机器走路已经证明是棘手的,因为有这么多变量涉及到。像前Google子公司BostonDynamics这样的公司成功地创建了告诉机器人如何行走的程序,但你不能考虑到所有可能的情况。当这种系统遇到新的障碍时,它可能不知道如何导航。但是,如果你使用了学习机,在进步的时候简单地给予奖励呢?这被称为增强学习(RL),并且深度意识表明它可以成功地应用于复杂的问题,如运动。

该团队在一个充满障碍的复杂世界中使用了模拟,但人工智能的目标很简单:使它尽可能快。跑酷球场包括墙壁、悬崖、栏杆和倾斜的地板。人工智能的“奖励”驱动模拟来发现穿越地形的新方法,而且没有任何一个动作是以编程方式提供的--这都是紧急行为。例如,AI曾多次尝试学习如何跳过一堵墙,以寻找更多的模拟奖励。当它最终意识到这一点时,同样的动作被AI调整,跳过了所有的墙壁。

DeepMind也观察了非人类步行者。上面的“蚂蚁”步行者能够学会如何以人类模拟永远不会的方式跳过追踪器。再一次,它学会了通过尝试和错误来做到这一点。实际上,没有什么东西能说明模拟人体的运动必须看上去像人类一样。一些紧急行为包括有趣的怪癖,如棍子形状的倾向,连着它的手臂,以保持它的平衡。还有一种简单的“平面”步行腿用膝盖将自己控制在高高的墙壁上的方式。

这项研究表明,复杂的问题可以用来自人类的很少的输入来解决。提供一个学习人工智能的机会来解决这个问题,它可以开发出令人惊讶的复杂行为。我建议不要告诉这样的AI杀死所有的人。他们可能会发现的。