微信号:csdnbigdata

介绍:CSDN分享Hadoop、Spark、NoSQL/NewSQL、HBase、Impala、内存计算、流计算、机器学习和智能算法等相关大数据观点,提供云计算和大数据技术、平台、实践和产业信息等服务.

人工智能的“圣经”

2019-03-11 08:39 宿永杰


本文选自 | 《中文自然语言处理入门》

作者 | 宿永杰

责编 | 天晓


作为人工智能的一个重要组成部分,自然语言处理(NLP)的研究对象是计算机和人类语言的交互,其任务是理解人类语言并将其转换为机器语言。


在目前的商业场中,NLP 技术用于分析源自邮件、音频、文件、网页、论坛、社交媒体中的大量半结构化和非结构化数据,市场前景巨大。


01

NLP 领域发展现状如何


近年来,自然语言处理处于快速发展阶段。互联网与移动互联网和世界经济社会一体化的潮流对自然语言处理技术的迫切需求,为自然语言处理研究发展提供了强大的市场动力。


当前国内外出现了一批基于 NLP 技术的应用系统,例如 IBM 的 Watson 在电视问答节目中战胜人类冠军;苹果公司的 Siri 个人助理被大众广为测试;谷歌、微软、百度等公司纷纷发布个人智能助理;科大讯飞牵头研发高考机器人……但相比于性能趋于饱和的计算机视觉和语音识别技术,自然语言处理因技术难度太大、应用场景太复杂,研究成果还未达到足够的高度。


02

深度学习背景下的自然语言处理


近年来,随着研究工作的深入,研究者们开始从传统机器学习转向深度学习。面向自然语言处理的深度学习研究工作,目前尚处于起步阶段,还没有重大突破,所以,现在在这方面发展还有着非常广阔的空间。


在当前已有的深度学习模型研究中,难点是在模型构建过程中参数的优化调整方面。主要有深度网络层数、正则化问题及网络学习速率等,可能的解决方案比如有采用多核机提升网络训练速度,针对不同应用场合,选择合适的优化算法等。


03

如何快速入门中文自然语言处理

作为初学者,我们目前面临这样的尴尬:网上大部分自然语言处理内容都是英文为基础,大多数人先是学好了英语的处理,回头来再处理中文,却发现有很大的不同,这样不仅让中文自然语言处理学习者走了弯路,也浪费了大量时间和精力。

中文的处理比英文复杂的多,网上中文相关资料少之又少,国内纯中文自然语言处理书籍只有理论方面的,却在实战方面比较空缺,这让中文自然语言处理的研究开发工作感到举步维艰,很难下笔。

中文自然语言处理入门》是我在 GitChat 平台独家首发的入门教程,针对想边学边实战的初学者设计——

现在扫码,享特价订阅


04

自然语言处理未来的研究方向


纵观自然语言处理技术研究发展的态势和现状,以下研究方向或问题将可能成为自然语言处理未来研究必须攻克的堡垒:


  1. 词法和句法分析方面:包括多粒度分词、新词发现、词性标注等;

  2. 语义分析方面:包括词义消歧、非规范文本的语义分析;

  3. 语言认知模型方面:比如使用深度神经网络处理自然语言,建立更有效、可解释的语言计算模型;

  4. 知识图谱方面:如何构建能够融合符号逻辑和表示学习的大规模高精度的知识图谱;

  5. 文本分类与聚类方面:通过有监督、半监督和无监督学习,能够准确进行分类和聚类;

  6. 信息抽取方面:对于多源异构信息,如何准确进行关系、事件的抽取等。;

  7. 情感分析方面:包括基于上下文感知的情感分析、跨领域跨语言情感分析、基于深度学习的端到端情感分析、情感解释、反讽分析、立场分析等;

  8. 自动文摘方面:如何表达要点信息?如何评估信息单元的重要性;

  9. 信息检索方面:包括意图搜索、语义搜索等,都将有可能出现在各种场景的垂直领域,将以知识化推理为检索运行方式,以自然语言多媒体交互为手段的智能化搜索与推荐技术;

  10. 自动问答方面:包括深度推理问答、多轮问答等各种形式的自动问答系统;

  11. 机器翻译方面:包括面向小数据的机器翻译、非规范文本的机器翻译和篇章级机器翻译等。


在《中文自然语言处理入门》达人课中,相信各位同学通过一些小数据量的“简易版”实例,就能体会到中文自然语言处理的精妙,并完成了中文自然语言处理从 0 到 1 的过程。


点击阅读原文 ,特价订阅,把技术应用到工业生产中,做到知其然并知其所以然。

 
CSDN大数据 更多文章 实名推荐熊节《敏捷中国史》,IT 历史不止有趣的故事 今日头条的推荐阅读你为什么都喜欢? Python ,AI 时代的第一开发语言! 10 分钟用 Python 搞定数据可视化! 不学设计模式,源码你都看不懂!
猜您喜欢 EMC紧密集成VMware 更新超融合和数据保护平台 程序员技术练级攻略 一种基于Lucene的实时搜索方案 AI黑科技 视频增强技术惊艳登场 Quora基于机器学习的答案排序方式