这是什么神仙工业机械手臂,玩转魔方真带劲,麻麻赖赖的盘它

  大家知道什么是OpenAI嘛?下面小编给大家解说以下吼!OpenAI是由伊隆·马斯克(Elon Musk)兴办的非盈利性人工智能组织。为什么要提到这个组织呢?因为想给大家展现一个好玩的事物:让机械手能够像人手一样精准地支配物体。固然这种仿真外型的手掌我们曾经见过很多了,但让“手指”可以和人类的真手一样灵敏可动,对机械构造来说可不是一件简单的事。

  但你在下面的动图中也能看到,这套名为 Dactyl 的械手系统可以依照指令请求,轻松完成转动立方体的动作,而且这种复杂精妙的指尖操作,也显然要比过去我们所看到的机器人行走腾跃复杂得多。

  Dactyl 自所以可以完成这么高效的运作,和 Open AI 运用的强化学习算法有关系。就像是刚出生的小孩一样,AI 或是机器人刚造出来后同样什么都不懂,假如你希望它可以完整了解某项复杂任务的流程,肯定需求停止重复的锻炼。特别是关于真实存在的物理机器人来说,研讨人员常常要消耗大量的理想时间对其停止指导练习。

  但 OpenAI 如今的做法,却是让机器人在虚拟环境中停止自我学习。他们还会在锻炼的过程中增加大量的随机事情,让 AI 在这个过程中本人领悟出完成任务的窍门。


  以这次的机械手掌为例,首先,他们会教诲机械手臂依照指令,将六面立方体中的正确颜色翻转出来;然后便开端改动四周环境的灯光,以及立方体的颜色、重量和纹理等;以至还会改动锻炼过程中的重力环境要素。

  之所以会参加这些随机化的变量,也是为了让 AI 能更好的应对各种不测状况的发作:“比方说不同的重力环境下,Dactyl 本人就会去领悟这会对立方体操控形成哪些影响。不然在理想世界中,一旦我们改动手臂的高度,立方体可能就会从手中滑落。”

  这种虚拟环境的锻炼形式还有一个益处,那就是不会消耗理想世界的时间。目前 Dactyl 曾经积聚了大约 100 年的锻炼经历,尝试用无数种办法来控制立方体的转动,但实践上这个过程只相当于我们理想世界中的 50 个小时而已。

  在虚拟世界里完成锻炼后,AI 积聚的经历就能够直接在理想世界中展示出来了。往常 Dactyl 曾经能够连续完成 50 次的立方体旋转操作,且不会出错。

  值得一提的是,这种超高效的锻炼形式不只能运用在物理机器人上,也同样能够用于其它的虚拟 AI 模型。在去年 7 月份,OpenAI 开发的 Open AI Five 也同样在虚拟世界里阅历了上万个小时的学习,实践上只是破费了几天的时间,然后它便在 Dota2 游戏中击败了职业选手 Dendi。

  固然只是一次 solo 对决而非 5v5,但照旧让我们看到了人工智能在电竞这种复杂范畴的有效性,包括我们所熟知的“围棋杀手” AlphaGo,也是 DeepMind 公司运用深度强化学习锻炼出来的 AI 模型。

  听说强化学习的灵感最早来源于人类对自然界动物学习过程的长期察看,之所以近几年内才开端尝试,也是受益于神经网络技术的进步,以及 OpenAI 自身的范围优势。毕竟想要完成这种超高效的强化学习流程,自然也得付出不小的运算本钱。

  依照 OpenAI 给出的数据,Dactyl 的锻炼设备动用了约 6144 颗 CPU,以及 8 颗来自 Nvidia 的 V100 GPU,这种范围的根底硬件只要很少数的研讨机构才干够运用。

  不过也有机器人专家以为,OpenAI 这种工业机械手臂水平的实验结果照旧很局限,能否真正处理理想世界的人类难题依然是一个未知数。