2019-11-08 17:30

AI研究人员通过将魔方交给魔方来测试机器人的敏捷性

导读人类可以相对轻松地操纵Rubik的立方体,但是从历史上看,机器人的使用难度更大。(一个经典的2 x 2 x 2多维数据集具有3,674,160个内部配

人类可以相对轻松地操纵Rubik的立方体,但是从历史上看,机器人的使用难度更大。(一个经典的2 x 2 x 2多维数据集具有3,674,160个内部配置。)这并不表示该规则也没有例外- 麻省理工学院的一项发明最近以创纪录的0.38秒解决了一个多维数据集-但它们通常涉及专门构建的电机和控件。

令人鼓舞的是,腾讯和香港中文大学的一组研究人员表示,他们已经设计了使用多指手的魔方机械手。在预印服务器Arxiv.org上的一篇论文中(“ 学习用灵巧的手解决魔方的难题”),他们声称拥有自己的AI系统,该系统包括一个确定最佳移动顺序的多维数据集求解器和一个用于控制最佳移动顺序的多维数据集运算符。到五个手指-在1,400个试验中平均成功率为90.3%。

研究人员写道:“进行手动操作是机器人实现人类水平的敏捷性并完成涉及丰富接触的日常任务的关键组成部分。” “尽管取得了进步,但可靠的多指灵巧手操作仍然面临着开放的挑战,因为其复杂的接触方式,高尺寸的动作空间和脆弱的机械结构。

团队的解决方案是一个分层系统,将基于模型和无模型的计划和操作组件结合在一起。前述的多维数据集求解器找到了恢复Rubik多维数据集的最佳移动顺序,而控制器(由两个原子动作,多维数据集旋转和逐层操作组成)逐步执行每个移动。

团队注意到,运动学和关节运动使某些动作比其他动作更难完成。为了定量比较其可靠性,他们分别培训了几种模型。为了提高多维数据集旋转和逐层操作的鲁棒性,这些操作在没有反馈信号的情况下顺序执行,他们实施了一种回退机制,该机制可在每个步骤检查Rubik多维数据集的状态。

团队使用了Roboti的接触式多关节动力学(Mujoco),这是一种为机器人和生物力学的研究与开发而设计的物理引擎,用于验证他们的方法。在Mujoco内,他们轻拍了一个灵巧的人类大小的机械手,称为“影子手”,其中有中指和无名指,每个都有三个被致动的关节和一个未致动的关节,以及一个小小的手指和拇指,有五个被致动的关节(加上一个手腕有两个被致动的关节)。在一个实验中,“暗影之手”的任务是操纵虚拟魔方以获得目标姿势,而在另一个实验中,它必须操纵两层才能达到目标角度。

研究人员报告说,他们的模型实现了稳定的多维数据集旋转成功率超过90%(在训练了30,000次情节后提高到95.2%),平均分层操作成功率达到90.3%(使用随机块进行1000次)姿势)。他们说,通过共同优化两个原子动作并将系统部署在实际硬件上,可以进一步提高性能。