谷歌开源MobileNets,将计算机视觉模型带入智能手机


谷歌开源了 MobileNets,它是一个支持多种视觉识别任务的轻量级模型,还能高效地在移动设备上运行。谷歌希望 MobileNets 可以最大限度的提高视觉识别软件的准确性,而不用大量的人力。


它对于 Google Photos 这样的功能非常有用,因为 Google Photos 依赖于视觉识别来整理照片。但更重要的是,MobileNets 能更好的帮助即将的 Google Lens。



Google Lens 是一个添加到 Google Photos 和 Assistant 助手的 AR/AI 功能,今年晚些时候将推出。这个功能配合你的手机摄像头就像搜索引擎一样,比如,相机对准餐厅会弹出评论和即时信息,而不用物理搜索。


MobileNets 能让 Google Lens 的功能变得更强大、功耗更小。它具有面部分析、检测物体、分类物种和识别地标的能力。这对于谷歌来说是一个大创新,但这也意味着主流手机开始更深入的学习。


MobileNets 的开源取决于苹果推出的 ARKit,为了在 AI/AR 领域抢占先机,谷歌也紧随其后。


Next Reality 的专家Jason Odom表示,苹果 ARKit 的发布,本质上已经威胁到了谷歌长期以来的 AR Tango 硬件项目。虽然苹果的解决方案可能是功能较弱的版本,但它不需要特殊的硬件来完成。这是一件大事,而谷歌也是知道的。




以前,因为电池寿命的限制,移动设备对 AI 工作的支持并不够强大。相反,他们使用云服务,通过应用程序给用户提供信息。这样做很好,但是存在延迟和隐私的问题,因为云服务很容易让信息受到黑客攻击和网络攻击。


由于谷歌已经对 MobileNets 做了所有优化,并且对这些模型进行了预先训练,因此, MobileNet 中的一系列模型都是小型、低延迟、低耗能的模型。开发者可以根据自己的需求轻松挑选应用程序的模型。


谷歌确保所有人都能根据空间需求和可接受的延迟来访问 MobileNets,MobileNets 的功能显示了谷歌在智能手机中完善 AI 和 AR 的决心。


via Next Reality


魔多,最专业的VR媒体,有料更有趣


// share