微信号:infoqchina

介绍:有内容的技术社区媒体

百分点集团刘译璟:人工智能四大挑战及对策

2017-07-02 09:00 XWorld

我们已经处在技术复兴的时代,伴随数据量爆发、大数据技术发展以及 GPGPU 等高性能计算硬件的成熟运用,让人工智能技术在经历多年的不温不火后,重新吸引了大众的眼球。本轮人工智能的关注热点,主要集中在机器视觉、机器听觉、自动驾驶、机器人等看起来更加“贴近自然”的领域上。事实上,以机器学习、自然语言处理为代表的一系列人工智能技术早已在互联网领域运用多年,并取得了辉煌的商业成果。

当前,虽然人工智能得到了资本的大力追捧,但真正大规模运用且成功的应用仍然集中在精准营销、个性化推荐等互联网场景中。而新一代的身份认证、语音助手、客服机器人、自动驾驶等人工智能应用才刚刚起步,离“叫好叫座”尚有不少的距离,甚至我们还不清楚它们是否真能带来巨大的商业回报。那么,下一步人工智能往何处发展?是否这一波热潮过去后又会归于平静,重回学术界的研究?

百分点集团技术副总裁兼首席架构师刘译璟认为,当前的人工智能技术还只能在较窄的场景下应用,要想更好的解决现实问题,人工智能还需要在理论、技术和数据上进行大的突破。未来的技术重点将集中在如下一些领域。

一、多种建模方式相结合

传统的人工智能实现方式,往往是由各个终端将数据汇总到云端,而后在云端进行集中式的建模,并以 SaaS 方式对外提供服务。之所以采取这样的方式是因为只有在云端才能集中大量的计算资源,进行复杂的建模和推理。但这种建模方式存在很大的问题:一是其应用对网络环境的要求极高,例如 Siri 一旦连不上网络就完全无法使用了;二是很难做到实时响应,这对于像自动驾驶之类的应用场景来说是致命的;第三,数据汇总到云端还存在隐私泄漏、数据安全等一法律和道德问题,增加行业潜在风险。从另外一个角度来看,云端集中建模的方式也比较低效,这是因为各个终端所面对的环境是千差万别的,反映在数据层面就是各个终端的数据个性十足,将这些个性十足的数据汇总到云端再统一处理,显然不如在各个终端先进行标准化再交给云端建模效率高。这种理念,特别类似于我们在 SQL 优化中先执行 WHERE 再进行 JOIN。

解决上面问题的思路,就是集中式建模(云计算)+ 微建模(边缘计算)的结合。边缘计算可以对一些简单的问题进行自行处理并将处理后的结果传输给云端。可以说,边缘计算是云计算的缩小加持版本,是靠近设备的小型数据中心。

边缘计算也助推了物联网的发展,物联网的核心是让每个物体智能连接、运行,物联网不止在改变人们日常的生活习惯,实际上,它更是在创造新的“生态”环境,借助边缘计算,通过设备端的数据分析处理,就可实现物与物之间的传感、交互和控制。

除此之外,因靠近设备,边缘计算还解决了从网络边缘到云数据中心网络带宽、延时的限制,作为一种本地化的计算模式,边缘计算提供了对于计算服务需求更快的响应速度,而且通常情况下,它不将大量的原始数据发回核心网,这使其在涉及个人隐私保护与数据安全方面的优势尤为明显。并且,边缘计算不需要主动协助 IaaS、PaaS、 SaaS 和其他云服务,更多地专注于终端设备端,可以节省能耗。

我们看到 Google 也在推进这种建模理念。Google 近日推出一个专门针对移动电话而优化的 Tensorflow 版本: Tensorflow Lite,它允许开发人员在用户的移动电话上实时地运行人工智能应用。利用 Tensoflow Lite,我们能将一些人工智能的处理转移到用户的移动电话端。这不仅可以节省处理能力,而且降低了数据量。此外,它同样可确保用户的数据的私有性,可不再依赖于因特网连接。

二、多种人工智能技术相融合

本次的人工智能热潮,让深度学习广为人知,甚至许多人认为深度学习可以包打天下,是实现人工智能的终极武器。这其实是一种相当大的误会!

我们知道深度学习本质上是一种从数据中归纳规律的方法,它需要海量的样本进行训练,例如 AlphaGO 的自我对局,学习样本越多,效果越好。而且,深度学习的层数越多、特征越多,需要的数据量就越大。但在真实的业务场景中,我们有这么多的数据吗?例如围棋、游戏这一类可以不断重复的场景,我们有可能迅速积累数据。但现实中我们面对的是投资理财、商品交易、政府决策、灾害评估这些场景,这些场景下的数据往往少得可怜。即使我们能积累出足够多的数据,也是需要相当长的时间。因此,在这些场景下,深度学习无能为力。

另外,深度学习是一种端到端的学习方式,整个学习过程中不需要人的干预。直接把海量数据投放到算法中,让数据自己说话,系统会自动从数据中学习。从输入到输出是一个完全自动的过程,这也造成了深度学习有自身的两个局限:不可解释和缺乏反馈机制。简单来说,我们既不知道模型学到了什么知识,也无法将这些知识举一反三到其他场合,我们还无法对学习到的知识进行评估并优化模型。事实上,深度学习的前身是人工神经网络,它只是人工智能中连接主义派别的一种方法而已,远远达不到包打天下的程度。从 1956 年人工智能这个概念提出开始,脑洞大开的学者们相继提出了三个研究学派,或者说三类思潮、三类哲学思想,分别是:符号主义、连接主义和行为主义。

符号主义起源于数理逻辑。它认为人的智能或者人的智慧、人的思维是一种理性的活动,我们可以研究清楚人的思维到底是如何运作的,然后把它编码到程序中实现智能。这一派的典型的技术就是知识表示、知识推理,以前的知识工程,专家系统等技术等都属于这一派。简单来说符号主义是研究并模拟人的思维方法,进而打造一个像人那样思维的机器。

连接主义受仿生学影响,期望通过模拟人脑的结构实现智能。其中的典型代表就是人工神经网络。顾名思义,人工神经网络就是受到了人脑结构(神经元、突触等)的启发,企图从软件和硬件角度去模拟神经元以及神经元之间的连接,让这些软件和硬件像人那样“思考”。当然,我们不难想象到,即使这些软件和硬件真的“思考”了,我们也不知道它们到底是怎么思考的,是不是像人类一样在思考,这也是这一派最被人诟病之所在,因为毕竟我们没有搞清楚人类到底是如何思考的。简单来说,连接主义是研究并模拟人脑的物理结构,进而打造一个拥有类似于人脑活动的机器。

行为主义则起源于控制论,它认为智能是一个生命体在和环境的不断交互中习得的,是“进化”而来的。例如,人类一开始没有什么智能,一无所知,但在与大自然的交互中,环境不断的给人类反馈,告诉人类这样的行为行不通、会碰壁、甚至会挂掉;而另外一些行为会得到自然的馈赠,让人类生活得更舒适。于是,人类在世世代代的生活中习得了“智慧”!行为主义的观点是我们需要建设一种可以与环境交互的系统,让它进化来获得智能。这一派的典型技术是强化学习,在反馈中不断优化模型的效果。简单来说,行为主义是研究并模拟人类与环境的交互,进而打造一个可以自主地与环境交互的机器。

可以看出,这三个派别有着根本不同的哲学理念,发展出的技术也各有所长。在人工智能的未来发展中,所有这些技术一定会有深度的融合。事实上,现在已经看到了许多这样的趋势,例如 AlphaGo 就是深度学习和强化学习结合的例子,之所以能在围棋上把人类完全击倒,是因为它把端到端的深度学习应用在强化学习上,不仅通过完全的自学习、自我修炼、自我改正,从而不断迭代,还能使得强化学习应付大数据。另外一个例子是深度学习和迁移学习的结合。迁移学习能够将适用于大数据的模型迁移到小数据上,利用旧领域的知识更好地完成新领域的学习。迁移学习和深度学习的结合在一定程度上可以解决数据缺失和冷启动问题。

三、知识工程和数据标准

上面提到了现实业务中我们往往无法获得海量数据,此时机器学习将面临冷启动的问题。解决冷启动,很重要的一种思路是利用人们在该领域中已有的经验和知识,将这些知识“告知”计算机,并让它利用这些知识解决问题。人工智能中的知识表示理论,就是这样的初衷。它研究的是如何将人类的知识用计算机可以理解的语言表达出来,以及如何让计算机在这些知识上进行推理,典型的技术包括本体、语义网,以及最新的知识图谱。

建设一个实用的知识图谱并非易事,它首先需要人们将已有的知识清晰准确的梳理出来,而后用实体、属性、关系等方式去描述,这期间涉及到大量业务专家和技术人员的工作,我们称之为知识工程。但一旦建立好这样的知识图谱,将不仅对单个企业,还将对整个行业、乃至整个世界都会带来极大的价值。目前像 Google、微软这样的巨头已经在纷纷建设自己的知识图谱。

可以预料到,人工智能的进一步发展一定会依赖于各行各业知识图谱的建设,否则人工智能终将停留在实验室而无法深入到真实业务中。因为业务中的历史经验和知识是万分宝贵的。在这许许多多知识工程的开展过程中,我认为人们会逐步形成行业甚至世界范围内的数据标准。从信息产业的发展历程来看,我们经历了从五花八门的硬件规范到行业硬件标准建立的过程,我们正在经历五花八门的软件规范到行业标准施行的过程,在数据标准建立上,我们也势必会经历从行业标准的慢慢建立到逐渐推广过程。一旦数据有了标准,知识工程的开展将简单许多,人工智能的应用也将更加深入。

四、其他理论和学科的支持

人工智能是一门非常综合的学科,它与哲学、数学、物理学、信息学、心理学和生命科学等密切相关。人工智能的进一步发展也有赖于这些领域的进步。目前来讲,我们认为量子计算将给人工智能带来新的飞跃。这是因为,一方面在理论上已经证明了量子算法可以极大的提高机器学习的效率,例如 QSVM(量子支持向量机)、QDL(量子深度学习);另一方面,由于量子理论与意识之间微妙的关系,量子计算有可能会为人工智能带来“意识”,那将可能是人工智能最激动人心的一刻。

眼下,像 IBM、Google、微软这样的巨头早已开始布局量子计算领域。D-Wave 公司的量子退火机,已经在退火优化算法上实现了数万倍的加速,这对人工智能来说意义重大。毫不夸张地说,量子计算是人工智能的下一个期待。

最后,在人工智能几起几落之后,利用人工智能解决现实的问题已成为迫切需求。针对眼下人工智能领域的创业和投资热潮,我们认为只有深入到行业中解决具体的问题,才能让企业真正立足。这就要求企业不能只是埋头钻研技术,而必须抬头看客户钻研业务需求,从一点一点的小事做起。只有企业持续不断地创造价值,行业才有可能持续不断地发展。


2017 年 7 月 6 日,邀请你带着对人工智能和大数据的想象力,与 XWorld 一同探索人类、社会与商业的未来进化图谱。我们准备了 100 个免费参会名额,请你参加 XWorld “大数据与人工智能新前沿论坛”~ 点击「 阅读原文 」,填写信息,即可申请哟!

 
InfoQ 更多文章 Q新闻丨Win 10 1.2GB 源码泄露;模块化系统终获通过,Java 9预计9月发布 技术漫谈:为什么Netflix的企业文化会备受整个硅谷的推崇? 京东商城交易平台的高可用架构之路 道哥:我人生有两大选择,为的却都是同一件事 技术漫谈:如何用经济学原理打造团队领导力与软技能?
猜您喜欢 (伪)msf 渗透 win2k3流程 [原]django构建简易博客系统 网约车市场短暂的双寡头时代结束,滴滴和Uber中国合并之后的数据研究 全国低于30ms响应速度:千万级魅族用户的异地多点网络架构如何优化 大数据五问五答 by CrazyJvm