硅谷大亨的AI机器人居然一不小心就被VR“调教”了!


传授无人机正确躲避障碍物的姿势


记性好的童鞋还记得微软开源了一个“空中信息与机器人平台”(代号 AirSim)吧!AirSim 是一个高级虚拟现实训练系统,简单来说,就是用 VR 训练 AI。


这个开源项目意义重大,特别是对人工智能公司来说,省去了机器学习大量的时间和人力成本。


现在,OpenAI 也来凑热闹了!


(OpenAI 是一家人工智能非营利组织,由几位硅谷大亨联合创立:SpaceX 的创始人伊隆·马斯克,硅谷知名创业加速器 Y Combinator 的总裁萨姆·阿尔特曼等。据说他们要给 OpenAI 注资 10 亿美金,为了推动人工智能的积极发展,预防它造成的灾难性影响)



他们的机器人并不长这样,后面你就知道了


OpenAI 的第一个目标是制造通用机器人,以后帮大家做做家务,你无聊时陪你聊聊天啥的。不过要让机器人如此智能,需要大量的训练。


之前,OpenAI 是这样训练机器人的。




OpenAI 开源了一个模拟机器人训练的软件 Roboschool,它可以设计多个模拟器,在同一场景中训练一个或多个机器人


现在,OpenAI 是这样训练机器人的。




OpenAI 开发了一种单次模仿学习算法(one-shot imitation learning),只要人在 VR 里演示一遍动作,机器人就能照着这个演示模仿学习。


灵感来源于刚出生 10 分钟的婴儿就会模仿大人吐舌头了,OpenAI 希望自己的机器人也能快速模仿人类,用这种方式学习新东西。




这是他们的仿真训练概念系统:we teach the robot。




人先在 VR 里演示一遍这个任务,把  6 个不同颜色的小方块堆成一个塔。




然后通过 VR 向机器人传达指令,让它学会堆小方块。




不管你怎么摆放 6 个小方块,最终机器人都会采用相同的顺序,摆成跟人类操作一样的结果。




那么,这个系统是如何工作的呢?


它要让机器人头上的相机感知环境,让它的手臂操纵小方块。




而这些都靠 OpenAI 的单次模仿学习算法来实现。算法的核心是让两个神经网络(基于人脑的计算机系统)一起工作:视觉网络(Vision Network)和模仿网络(Imitation Network)。




视觉网络是一个深度神经网络,负责处理相机拍摄的图像,来帮助机器人确定积木的位置。




研究人员用不同的光线、纹理和对象的组合,生成成千上万张模拟图像。




然后利用这些模拟图像来训练视觉网络。




接着,视觉网络收集到的信息会传送给模仿网络。




模仿网络要经过几十个不同的任务训练,每次任务包含上千次演示。每次训练,模仿网络都可以观察到两个演示案例。第一次演示,模仿网络可以全方位仔细观摩,第二次只会被展示一次。




然后,研究人员就会使用监督学习,让机器人预测演示者下一步会采取什么行动。也就是说,机器人必须要学习如何从第一次展示中,就推测出下一步的行动。


这个算法已经教会了机器人如何堆方块,不过,OpenAI 的研究人员表示,它还可以让机器人学其他的任务。




魔多君觉得,这个技术一旦成熟了,对人工智能真的是突破性的!


因为训练神经网络需要一个庞大的数据库,比如你训练 AI 识别一只猫,你就要给它好多好多猫的图片,依靠人工来把关键的信息点标注出来。



人工智能画猫片


而人工标注数据一个极其费体力的活,相当熬人,直接影响训练的质量。就像你在日常工作中做信息搜集和分类时,得花大量的时间,无聊枯燥。


OpenAI 用 VR 训练机器人解决了神经网络“标记数据”这个重大的问题,省去大量的人工成本,与谷歌在今年 I/O 大会上提到,研发一种用来自动标注数据的神经网络不言而喻。


魔多,最专业的VR媒体,有料更有趣



// share