谷歌的DeepMind教人工智能如何在跑酷课程中导航

谷歌最初是一家搜索和广告公司，但其幕后的努力已经越来越多地转向机器学习和人工智能。这不仅对搜索有用，而且在无人驾驶汽车、计算机视觉等领域也很有用。这家搜索巨头几年前收购了DeepMind，推动了其人工智能研究的过度发展，现在我们开始看到谷歌产品的好处。来自DeepMind的一个新的研究项目显示，通过教模拟的类人如何在跑酷课程中导航，人工智能可以走多远。

教学机器走路已经证明是棘手的，因为有这么多变量涉及到。像前Google子公司BostonDynamics这样的公司成功地创建了告诉机器人如何行走的程序，但你不能考虑到所有可能的情况。当这种系统遇到新的障碍时，它可能不知道如何导航。但是，如果你使用了学习机，在进步的时候简单地给予奖励呢？这被称为增强学习(RL)，并且深度意识表明它可以成功地应用于复杂的问题，如运动。

该团队在一个充满障碍的复杂世界中使用了模拟，但人工智能的目标很简单：使它尽可能快。跑酷球场包括墙壁、悬崖、栏杆和倾斜的地板。人工智能的“奖励”驱动模拟来发现穿越地形的新方法，而且没有任何一个动作是以编程方式提供的--这都是紧急行为。例如，AI曾多次尝试学习如何跳过一堵墙，以寻找更多的模拟奖励。当它最终意识到这一点时，同样的动作被AI调整，跳过了所有的墙壁。

DeepMind也观察了非人类步行者。上面的“蚂蚁”步行者能够学会如何以人类模拟永远不会的方式跳过追踪器。再一次，它学会了通过尝试和错误来做到这一点。实际上，没有什么东西能说明模拟人体的运动必须看上去像人类一样。一些紧急行为包括有趣的怪癖，如棍子形状的倾向，连着它的手臂，以保持它的平衡。还有一种简单的“平面”步行腿用膝盖将自己控制在高高的墙壁上的方式。

这项研究表明，复杂的问题可以用来自人类的很少的输入来解决。提供一个学习人工智能的机会来解决这个问题，它可以开发出令人惊讶的复杂行为。我建议不要告诉这样的AI杀死所有的人。他们可能会发现的。

谷歌的DeepMind教人工智能如何在跑酷课程中导航

猜你喜欢

最新文章