在一个高度竞争的世界里,人工智能能否进化并变得更加复杂,类似于地球上的生命是如何通过竞争和自然选择进化的?这是一个问题,OpenAI的研究人员一直在通过实验试图回答这个问题,包括最近让AI代理在近5亿次的捉迷藏中相互竞争的问题。他们发现,人工智能代理或机器人在玩游戏时可以想出几种不同的策略,并开发新的策略来对抗其他团队提出的技术。
起初,捉迷藏和搜索者只是在环境中奔跑。但是在2500万次游戏后,这些陌生人学会了如何用盒子堵住出口,在房间里设置障碍。他们还学会了如何相互配合,互相传递箱子,快速停止出口。然后,探索者通过将舷梯移动到墙上并使用它们来克服障碍,并在7500万次比赛后学会了如何在这些堡垒中找到隐藏者。然而,在大约8500万次游戏后,隐藏者学会了在封锁出口之前将他们带进堡垒的坡道,因此搜索者没有工具可以使用。
正如OpenAI的鲍恩贝克所说:
“一旦一个团队学会了新的策略,就会给另一个团队带来压力。有一个很有意思的类比,那就是人类在地球上是如何进化的,你们之间的生物之间会有不断的竞争。”
特工的发展甚至不止于此。最后,他们学会了如何在他们的环境中使用毛刺,例如,通过以一定的角度推动它们穿过墙壁来消除坡度。鲍尔说,这表明人工智能可以找到我们可能没有想到的复杂问题的解决方案。“也许它们甚至可以解决人类不知道如何解决的问题,”他解释道。

