微信号:tech5ai

介绍:中国顶尖人工智能与机器人行业新媒体平台,专注国内外人工智能、机器人、AR/VR、无人驾驶等科技前沿的深度报道.

时代广场采用了谷歌技术,无处不在的摄像头、无处不在的算法

2018-06-22 11:27 人工智能机器人联盟

时代广场采用了谷歌的NASNet技术,计算机视觉系统对漫步在广场的人群、车辆、物体进行检测。以后人类的一举一动都逃不过计算机的监视。无处不在的摄像头、无处不在的算法、无处不在的监控,也许隐私需要重新被定义。

几个月前,谷歌引入了AutoML,这是一种自动化机器学习模型设计的方法。虽然机器人能够设计出与人类专家设计的神经网络相同的小型神经网络,但这些结果被限制在诸如cifar-10和PennTreebank这样的小型学术数据集上。那么,这个方法如何在诸如ImageNet图像分类和COCO对象检测等更具挑战性的数据集上执行呢?

戳视频 ↓ ↓ ↓

谷歌NASNet技术对漫步在时代广场的目标检测

许多先进的机器学习架构都是由人类发明的,用来在学术竞赛中处理这些数据集。在学习可扩展图像识别的可转换架构中,我们将自动的应用到ImageNet图像分类和COCO对象检测数据集这两个计算机视觉中最受尊敬的大型学术数据集。

为了能够将方法应用到ImageNet中,我们已经改变了方法,这对大规模数据集来说更易于处理:

·重新设计搜索空间,使自动化系统能够找到最好的图层,然后以灵活的方式多次堆叠,创建最终的网络。

·在cifar-10上进行了架构搜索,并将最好的学习架构迁移到ImageNet图像分类和COCO对象检测上。

通过这种方法,找到在cifar-10上运行良好的最佳层,在ImageNet分类和COCO对象检测中也工作得很好的。然后将这两层合起来形成了一种新的架构,称之为“NASNet”。

▲NASNet体系结构由两层组成:普通层(左)和还原层(右)这两个层是由AutoML设计的

在ImageNet图像分类中,NASNet在验证集上达到了82.7%的预测精度,超过了之前所构建的所有初始模型。此外,NASNet比之前所有发布的结果都要出色地完成,并且与arxiv上公布的最好的结果不相上下。

▲在ImageNet图像分类中,NASNet和最先进人类发明的模型在不同的模型尺寸上的准确性

此外,NASNet还可以调整大小,以产生一组模型,这些模型在计算成本非常低的情况下取得了良好的准确性。例如,一个小版本的NASNet准确度达74%,比为移动平台提供的同等大小的最先进的模型要高3.1%。最大的NASNet已经达到了最先进的精度,同时将最佳报告结果的计算成本减半。

▲对象检测使用NASNet的Faster-RCNN

谷歌也将从ImageNet的学习功能转移到对象检测。在实验中,结合ImageNet分类的特征与faster-rcnn框架,超越了先前发表的,最先进的可预测性能。最大的模型map(平均准确率)达到了43.1%,比之前的版本好4%。

NASNet在ImageNet和COCO上学习的图像特征可能会被用于许多计算机视觉应用。因此,研究人员将NASNet开源。将更大的机器学习社区建立在这些模型上,以解决还没有想到的许多计算机视觉问题。

作者: 李佳惠

 
人工智能机器人联盟 更多文章 富士康老板郭台铭:5年内机器取代8成工人 从25岁住在父母家到29岁退休,我的财务自由故事 英伟达再现AI黑科技,让视频帧数翻倍慢放如丝般顺滑 恒大67亿港元为FF加血,许家印神助攻放飞贾跃亭汽车梦 玩游戏学微积分?腾讯代理《微积历险记》终于屏蔽小学生
猜您喜欢 无人机抓蚊子?微软研究项目帮助追踪病毒传播 #一周读书报告(2)# 本周推荐《岛上书店》:讲述了一个非常温暖的故事的一本书(单) 给Java程序猿们推荐一些值得一看的好书 Python+tkinter+pillow实现屏幕任意区域截图 论数据库容器化的目标和价值