微信号:programmer_club

介绍:程序员第一自媒体,与你探讨码农人生路上遇到的各类泛技术话题,定期为你推荐码农人生思考、感悟以及启迪!

Google首款小程序「猜画小歌」用了哪些AI相关技术?

2018-07-25 22:00 程序员之家

这两天,谷歌推出的首款AI小程序“猜画小歌”彻底火了,朋友圈一时成为灵魂画师们的舞台。大体来说,就是你和AI玩一个“你画我猜”的游戏,你在屏幕上画个涂鸦,AI会猜测你在画什么。

(图片来自TechCrunch)


其实这款产品并非谷歌首次推出,它的原型是谷歌在2016年11月发布一款叫做Quick,Draw!的网页版小游戏。


Quick,Draw以及这款“猜画小歌”比较类似于前几年很火的手机游戏你画我猜,但不同的是,Google在这两款游戏中为用户安排的对手不是人类,而是人工智能。


在Quick,Draw!画板上画出一个涂鸦后,AI会随时给出它的猜测结果,当完成六次游戏后,系统会给出一个总览图,你可以点击每一幅图片来观察AI的识别结果并浏览其他人的绘制结果。



这两款游戏的本质其实就是一个图像识别分类过程,系统通过清洗、分析图形的特征,来判断图形的真正含义。谷歌在发布Quick,Draw!之初时,分享过一个视频,介绍了这款游戏的成型过程,可以帮助大家更形象的理解它背后的技术原理:




图像识别技术一直是人工智能的一个重要组成内容,也是Google一直努力的研究方向之一,性能良好图像识别模型具有重要的实用功能,可以广泛地应用于图片检索、媒体内容归类、视频监控等多个领域。


当然训练好这样的人工智能并不容易,谷歌在介绍“猜画小歌”时提到,Google AI 的神经网络驱动。该网络由全世界最大的、囊括超过 5000 万个手绘素描的数据集训练而成。去年8月份时,谷歌专门做过关于这个数据集的介绍,当时集智也做了分享


这个庞大的数据集是由1500余万用户在玩耍Quick,Draw!时和机器互动的过程中得来,目前收录了5千万幅涂鸦作品。谷歌已经将该数据集开源,将这些涂鸦画作整理为开放数据集(后面会扩充为8亿幅作品),旨在帮助全世界的开发者能用它训练神经网络,用来做数据分析、产品设计,帮助研究者们研究全球各地人们的绘画习惯,甚至帮助艺术家创作新奇的作品···





有这方面需求的朋友,不妨去看看,数据集地址:

https://github.com/googlecreativelab/quickdraw-dataset


数据集所在的GitHub仓库中也包含了有些开发者自己实现的Quick,Draw!模型,对于想复现这种技术的朋友来说很有借鉴意义,不要错过。


话说回来,和玩Quick,Draw!一样,我们在玩“猜画小歌”的同时,也在帮助AI成长。在Quick,Draw!发布之初时,它只使用了数百个训练数据,系统识别率并不理想,但经过后续多达千万个用户的参与和玩耍,多达几亿幅涂鸦作品帮助AI学习后,系统的识别率已经相当好,而且能识别出不同形态的同一物体(比如说对于宽檐帽和鸭舌帽的图形,系统均能准确地识别出是“帽子”)。


其实,这种人工智能的意义也绝非识别人类涂鸦和我们玩玩游戏这么简单。例如通过全球用户在Quick,Draw!上和AI的互动,我们就能发现不同国家的用户在认知角度与偏好上的差异,进而能了解全球各地用户在描绘事物时的审美观差异。通过这样AI就能为我们的产品和应用在不同国家和地区的本地化做出有意义的指导,比如网站和App的UI该如何设计。


AI在学习人们的涂鸦姿势和习惯后,甚至还能帮我们画画,比如谷歌在发布Quick,Draw!后不久,就在它基础上推出了一款叫做AutoDraw的绘画机器人,能将你的涂鸦自动升华为美丽的艺术图像。设计师朋友们想想看,以前需要自己用软件费时费力设计的图形,现在按大概模样随便涂涂画画后,AI就能自动帮你转化为需要的结果,如此省时省力,岂不美哉?



(AutoDraw效果示意图)



另外,通过识别和学习人类的绘画书写习惯,训练后的AI还能帮助警方破案!比如今年的ICFHR18大会上收录了一篇叫做《A New COLD Feature based Handwriting Analysis for Ethnicity/Nationality Identification》的研究论文,研究人员在收集五个国家公民的手写字体后对其进行了分析,然后用这些数据集训练了一个机器学习模型,能够通过识别字迹确定书写人的国籍。


研究人员随即选择了 100 名来自马来西亚、伊朗、中国、印度和孟加拉国的被试者,让他们手写同样的英文,然后使用一种线性分布(COLD)识别工具分析他们所写字体的形状分布特征,如直线度、弯曲度等。



(AI在分析不同国籍人员的书写习惯)



结果显示,即使不是书写该国文字,被试者的笔迹也呈现出明显的“国籍”特征。因为这是文字造就的书写习惯不同,即时换为书写另一种语言同样潜意识的保留了它们。例如,习惯汉字笔直笔画的中国人,即使是手写罗马字母,也不会改变直线书写习惯;而文字比较“圆润”的印度和孟加拉国,他们写出的字体则更“圆”。所以,假如案件中出现跨国嫌犯,物证中存在嫌犯留下的笔迹,AI就能分析出嫌犯的国籍。


随着训练数据越来越多、越来越广,人工智能会带来更多像这样的创新成果。


当然,Quick,Draw!以及“猜画小歌”最直接的意义是以游戏的方式让大众参与到机器学习过程中,从而让人工智能技术变得触手可及,人人都能上手体验AI的乐趣。


其实谷歌一直以来都有一个很好的传统,就是将其掌握和正在研究的各类项目转化为有意思的小实验来让普通用户体验和测试,比如包含Quick,Draw!小游戏的项目AI Experiments。


(AI Experiments绘画部分的小实验)



通过这些小游戏和小实验,让普通大众也能领略最新的人工智能技术,不失为一种富有创造力的方式。



作者:景略集智  来源:掘金

链接:https://juejin.im/post/5b559b76e51d45616f4596dd


公众号内回复“1”带你进粉丝群

 
程序员之家 更多文章 “死于25岁葬于75岁”:你的人生也会是这样的吗? “疫苗门”事件再度升级!程序员,黑客齐出手,搞死,搞臭那些假药商才是目标! 人死后QQ、微信号怎么办?我不禁陷入了沉思... 华为东莞新家内景曝光!你确定这不是5A景区? 为什么很多程序员工作时都戴耳机?
猜您喜欢 两种软件工程师与他们的工作态度 2016,新年听你说 让信息更有价值,HPE IDOL被Forrester评为认知搜索和知识发现解决方案的领导者! WEB开发者应该有哪些必备的技能? iOS 7 教程:让程序同时支持iOS 6和iOS 7