微信号:gh_acee3e9666da

介绍:IT出版旗舰品牌,实时发布最新鲜的IT热点图书资讯,分享优质图书内容,打造与万千精英读者良好的互动平台.

今日好书丨《深度学习核心技术与实践》

2018-03-08 17:31 博文视点Broadview


深度学习核心技术与实践

猿辅导研究团队 著

2018年2月出版


 

小编推荐:融汇ML与DL,用一线工程视角,透过关键概念、模型、算法原理和实践经验,让机器学习结合产品需求真正落地。


内容简介

本书主要介绍深度学习的核心算法,以及在计算机视觉、语音识别、自然语言处理中的相关应用。本书的作者们都是业界一线的深度学习从业者,所以书中所写内容和业界联系紧密,所涵盖的深度学习相关知识点比较全面。本书主要讲解原理,较少贴代码。

本书适合深度学习从业人士或者相关研究生作为参考资料,也可以作为入门教程来大致了解深度学习的相关前沿技术。


主编简介
  • 猿辅导应用研究团队

团队成立于2014年年中,一直从事深度学习在教育领域的应用和研究工作。团队成员均毕业于北京大学、清华大学、上海交大、中科院、香港大学等知名高校,大多数拥有硕士或博士学位。研究方向涵盖了图像识别、语音识别、自然语言理解、数据挖掘、深度学习等领域。团队成功运用深度学习技术,从零开始打造出活跃用户过亿的拍照搜题APP——小猿搜题,开源了分布式机器学习系统ytk-learn和分布式通信系统ytk-mp4j。此外,团队自主研发的一系列成果均成功应用到猿辅导公司的产品中。包括:速算应用中的在线手写识别、古诗词背诵中的语音识别、英语口语智能批改、英文手写拍照识别和英语作文智能批改等技术。

大咖推荐
  • 李勇 / 猿辅导公司CEO 

  • 袁进辉(老师木)北京一流科技有限公司创始人

  • 段亦涛/ 原百度商业UED 负责人


前言节摘

受益于当今学术开放开源的氛围,深度学习的最新算法甚至代码实践大家都能在第一时间进行学习。所以在创业公司的早期深度学习实践中,最重要的并不是算法理论方面的创新,而是结合产品需求如何进行深度学习技术的落地。这需要团队不仅对业务非常熟悉,也需要对深度学习相关算法了如指掌,同时还需要有人可以将算法真正用代码落地。很幸运,我们的团队具备这样的能力,所以在深度学习的实践中较少走弯路。随着多年的积累,团队在深度学习方面开始有不少自己的创新,也对理论有了整体的认识。从2016 年下半年开始,团队部分成员利用周末等业余时间撰写了这本书,算是对团队过去所学深度学习知识的一个总结。本书的撰写都是大家牺牲周末时间完成的,且在撰写过程中,碰到多次项目进度非常紧急的情况,周末时间也被项目占用,但大家还是克服困难,完成了书稿,非常感谢这些作者的配合!此外,猿辅导研究团队的大部分成员参与了审稿相关工作,在此一并表示感谢!

本书特点

本书首先介绍了深度学习的一些基本原理,然后介绍了计算机视觉、语音识别、自然语言处理的相关应用,最后介绍了一些较前沿的研究方向。

本书具有如下特点:

• 计算机视觉、语音识别、自然语言处理这三方面的介绍内容绝大部分是作者团队有过相关实践和研究的方向,和业界联系紧密。

• 所涵盖的深度学习相关知识点比较全面。

• 干货:主要讲解原理,较少贴代码。

本书读者

本书适合深度学习从业人士或者相关研究生作为参考资料,也可以作为入门教程大致了解深度学习的相关前沿技术。

关于团队

猿辅导研究团队成立于2014 年,是创业公司中较早从事深度学习的团队。该团队陆续将深度学习应用于如下领域:

• 拍照印刷体OCR(Optical Character Recognition,光学字符识别):从0 开始打造拍照搜题APP 小猿搜题(目前累计安装量达1.6 亿次)。

• 拍照手写体OCR:包括斑马速算产品中的屏幕手写笔迹的在线手写识别、拍照手写图片的离线手写识别、与公务员考试相关的申论手写识别等。

• 语音识别:包括古诗词背诵、高考听说自动判卷、英语口语打分等项目。

• 自然语言处理:主要应用于英语作文自动批改、自动判卷、短文本对话等项目。

关于公司

猿辅导公司是中国领先的移动在线教育机构,拥有中国最多的中学生移动用户,以及国内最大的中学生练习行为数据库,旗下有猿题库、小猿搜题、猿辅导三款移动教育APP。

2017 年6 月猿辅导获得由华平投资集团领投、腾讯跟投的1.2 亿美元E 轮融资,估值超过10亿美元,成为国内K-12 在线教育领域首个独角兽公司。


本书目录

  • 篇幅限制,部分小节未完整罗列,完整目录请见本书。

  • 第1 部分深度学习基础篇1

1 概述2

1.1 人工智能  3

1.2 机器学习  7

1.3 神经网络  12

2 神经网络17

2.2 神经元模型  19

2.3 感知机  27

2.4 DNN  29

3 初始化模型38

3.1 受限玻尔兹曼机  38

3.2 自动编码器  47

3.3 深度信念网络  50

4 卷积神经网络53

4.1 卷积算子  53

4.2 卷积的特征  56

4.3 卷积网络典型结构  59

4.4 卷积网络的层  61

5 循环神经网络68

5.1 循环神经网络简介  68

5.2 RNN、LSTM 和GRU  69

5.3 双向RNN  76

5.4 RNN 语言模型的简单实现  77

6 深度学习优化算法81

6.1 SGD  81

6.2 Momentum  82

6.3 NAG  83

6.4 Adagrad  85

6.5 RMSProp  86

6.6 Adadelta  87

6.7 Adam  88

6.8 AdaMax  90

6.9 Nadam  90

6.10 关于优化算法的使用  92

7 深度学习训练技巧94

7.1 数据预处理  94

7.2 权重初始化  95

7.3 正则化  96

8 深度学习框架103

8.1 Theano  103

8.2 Torch  105

8.3 PyTorch  113

8.4 Caffe  117

8.5 TensorFlow  125

8.6 MXNet  131

8.7 Keras  135

  • 第2 部分计算机视觉篇 140

9 计算机视觉背景141

9.1 传统计算机视觉  141

9.2 基于深度学习的计算机视觉  145

9.3 参考文献  146

10 图像分类模型147

10.1 LeNet-5  147

10.2 AlexNet  149

10.3 VGGNet  154

10.4 GoogLeNet  159

10.5 ResNet  165

10.6 DenseNet  169

10.7 DPN  170

11 目标检测173

11.1 相关研究  175

11.2 基于区域提名的方法  179

11.3 端到端的方法  186

11.4 小结  188

12 语义分割192

12.1 全卷积网络  193

12.2 CRF/MRF 的使用  199

12.3 实例分割  205

13 图像检索的深度哈希编码208

13.1 传统哈希编码方法  208

13.2 CNNH  209

13.3 DSH  210

13.4 小结  212

  • 第3 部分语音识别篇214

14 传统语音识别基础215

14.1 语音识别简介  215

14.2 HMM 简介  216

14.3 HMM 梯度求解  227

14.4 孤立词识别  234

14.5 连续语音识别  240

14.6 Viterbi 解码  243

14.7 三音素状态聚类  245

14.8 判别式训练  248

15 基于WFST 的语音解码256

15.1 有限状态机  257

15.2 WFST 及半环定义  257

15.3 自动机操作  260

15.4 基于WFST 的语音识别系统  277

16 深度语音识别288

16.1 CD-DNN-HMM  288

16.2 TDNN  292

16.3 CTC  295

16.4 EESEN  299

16.5 Deep Speech  301

16.6 Chain  310

17 CTC 解码315

17.1 序列标注  315

17.2 序列标注任务的解决办法  316

17.3 隐马模型  318

17.4 CTC 基本定义  319

17.5 CTC 前向算法  321

17.6 CTC 后向算法  324

17.7 CTC 目标函数  325

17.8 CTC 解码基本原理  327

  • 第4 部分自然语言处理篇334

18 自然语言处理简介335

18.1 NLP 的难点  335

18.2 NLP 的研究范围  336

19 词性标注338

19.1 传统词性标注模型  338

19.2 基于神经网络的词性标注模型  340

19.3 基于Bi-LSTM 的神经网络词性标注模型  342

20 依存句法分析345

20.1 背景  346

20.2 SyntaxNet 技术要点  348

21 word2vec 358

21.1 背景  359

21.2 CBOW 模型  366

21.3 Skip-gram 模型  369

21.4 Hierarchical Softmax 与Negative Sampling  371

21.5 fastText  372

21.6 GloVe  373

21.7 小结  374

22 神经网络机器翻译376

22.1 机器翻译简介  376

22.2 神经网络机器翻译基本模型  377

22.3 基于Attention 的神经网络机器翻译  379

22.4 谷歌机器翻译系统GNMT  381

22.5 基于卷积的机器翻译  382

22.6 小结  383

  • 第5 部分深度学习研究篇385

23 Batch Normalization 386

23.1 前向与后向传播  387

23.2 有效性分析  393

23.3 使用与优化方法  395

23.4 小结  396

24 Attention 397

24.1 从简单RNN 到RNN + Attention  398

24.2 Soft Attention 与Hard Attention  398

24.3 Attention 的应用  399

24.4 小结  401

25 多任务学习403

25.1 背景  403

25.2 什么是多任务学习  404

25.3 多任务分类与其他分类概念的关系  406

25.4 多任务学习如何发挥作用  409

25.5 多任务学习被广泛应用  413

25.6 多任务深度学习应用  416

25.7 小结  423

26 模型压缩426

26.1 模型压缩的必要性  426

26.2 较浅的网络  428

26.3 剪枝  428

26.4 参数共享  434

26.5 紧凑网络  437

26.6 二值网络  438

26.7 小结  442

27 增强学习445

27.1 什么是增强学习  445

27.2 增强学习的数学表达形式  448

27.3 用动态规划法求解增强学习问题  454

27.4 无模型算法  462

27.5 Q-Learning 的例子  467

27.6 AlphaGo 原理剖析  469

27.7 AlphaGo Zero  484

28 GAN 486

28.1 生成模型  486

28.2 生成对抗模型的概念  488

28.3 GAN 实战  492

28.4 InfoGAN——探寻隐变量的内涵  493

28.5 Image-Image Translation  496

28.6 WGAN(Wasserstein GAN)  499

A 本书涉及的开源资源列表 506


点击此处参与抽奖,选取1 名同学获赠此书,3月12日自动开奖。


 

博文视点

您阅读的专业智库

喜欢请分享至朋友圈

了解更多本书详情请点击阅读原文

长按二维码轻松关注


点击阅读原文,即可快速抵达本书详情页!

 
博文视点Broadview 更多文章 Kotlin构造函数与实例化 Kotlin:比 Java 做得更好 猫工智能:卷积神经网络层的实现 书单丨成为全栈工程师的5种硬实力 今日好书丨《Spring MVC+MyBatis开发从入门到项目实战》
猜您喜欢 新年献礼 | 100+ 最新Kubernetes峰会PPT下载 Jmeter实时性能测试数据的监控 IDC最新研究显示:亚太区企业组织正在加速采用大数据与分析 中国首份手机品牌忠诚度报告 平安金科云测试开放服务平台