微信号:programmer_club

介绍:程序员第一自媒体,与你探讨码农人生路上遇到的各类泛技术话题,定期为你推荐码农人生思考、感悟以及启迪!

R语言知识体系

2016-12-16 17:35 程序员之家

最近遇到很多的程序员都想转行到数据分析,于是就开始学习R语言。总以为有了其他语言的编程背景,学习R语言就是一件很简单的事情,一味地追求速度,但不求甚解,有些同学说2周就能掌握R语言,但掌握的仅仅是R语言的语法,其实这只能算是入门。

R是一种编程语言和进行统计分析、制作图形报告的软件。 R 语言由Ross Ihaka 和 Robert Gentleman在Auckland大学发明,目前,R由开发核心团队开发。

R语言在GNU General Public License协议下是免费的,为Linux, Windows 和 Mac 操作系统提供了预编译版本的R。

提供了如Linux,Windows和Mac不同的操作系统R是GNU通用公共许可证下免费提供,并预编译的二进制版本。

这种编程语言被评为R基上的两个R作者(罗伯特·君子和而罗斯Ihaka)的第一个名字的第一个字母,并在一定程度上对贝尔实验室的语言S的名字一出戏

R语言之所以命名为R,是根据其两位作者Robert Gentleman 和 Ross Ihaka的名字首字母而命名的。



R语言是一门统计语言,主要用于数学建模、统计计算、数据处理、可视化 等几个方向,R语言天生就不同于其他的编程语言。R语言封装了各种基础学科的计算函数,我们在R语言编程的过程中只需要调用这些计算函数,就可以构建出面向不同领域、不同业务的、复杂的数学模型。掌握R语言的语法,仅仅是学习R语言的第一步,要学好R语言,需要你要具备基础学科能力(初等数学,高等数学,线性代数,离散数学,概率论,统计学) + 业务知识(金融,生物,互联网) + IT技术(R语法,R包,数据库,算法) 的结合。所以把眼光放长点,只有把自己的综合知识水平提升,你才真正地学好R语言。换句话说,一旦你学成了R语言,你将是不可被替代的。


R的知识体系结构是复杂的,要想学好R,就必须把多学科的知识综合运用,所以最大的难点不在于语言本身,而在于使用者的知识基础和综合运用的能力。

首先,从宏观上让我们先看一下R的知识体系结构的全貌,然后再分别解释每个部分的细节。


 


图中我将R语言知识体系结构分为3个部分:IT技术 + 业务知识 + 基础学科。

IT技术:是计算时代必备的技术之一,R语言就是一种我们应该要掌握技术。

业务知识:是市场经验和法则,不管你在什么公司,都会有自己的产品、销售、市场等,你要了解你的公司产品有什么,客户是谁,怎么才能把产品卖给你的客户。

基础学科:是我们这十几年在学校学的理论知识,当初学的时候并不知道是为了什么,毕业后如果你还能掌握一些知识并实际运用,那么这将是你最有价值的竞争力。


每个部分知识单独看都有其局限性,但如果能把知识两两结合起来,就构成了我们现在社会的各种技术创新点。

IT技术+业务知识:创造了阿里巴巴的电子商务帝国,腾讯全生态链的社交网络。

IT技术+基础学科:创造了Google搜索的神话,华尔街金融不败的帝国。


当然,R语言只是一门计算机语言技术,不能独自承担改写历史的重任,但R语言确实给了我们很大的想像空间,让我们能动手去了解这个世界的规律,找到无穷无尽的交叉点,创造出新的帝国。


在此,国家为推动大数据分析,专门发布了R语言的红头文件,为国家培养R语言人才。


附件:

一、培训对象

各企业从事数据挖掘与分析的技术及管理人员,各高校相关专业负责人和骨干老师、高年级本科生及研究生。

二、培训目标

(1)让学员尽快掌握R语言的基本用法,掌握如何利用R丰富的网上资料和帮助系统,学会基本的编程方法。

(2)结合统计分析的思想和实际案例,深入浅出地讲解如何使用R语言进行实际数据分析,让学员不仅掌握R语言的使用,同时学会统计分析的思想。

(3)学完本课程后,使学员可以熟练的运用R语言进行实际的数据挖掘分析工作。学会R语言尤其是对于需要批量处理的实务数据分析来说,可以大大提高其工作效率。

(4)紧密结合应用实例,针对工作中存在的疑难问题进行分析讲解和专题讨论,有效提升学员解决复杂问题的能力

三、培训特点

培训以“实用,高效”为原则,没有复杂的算法,回避公式推导,全案例教学,用案例来介绍方法的思想及原理,然后通过R代码来介绍方法的实现,既用简洁易懂的语言讲述理论方法,又同时进行实际数据分析,展示R软件包及相关的程序,不仅仅适合零基础的R初学者,同时也适合经验较为丰富的R操作者。该课程可以保证学员直接进入处理实际问题的状态,灵活的运用课程所讲的方法和程序处理实际问题。提供全部教学内容讲稿、PPT、案例数据、全部源代码、编程操作步骤,建立与老师的长期的答疑联系。

四、时间地点

2016年11月12日~15日      深  圳

五、课程大纲

第一天

1讲:R语言编程基础

  1. 1.     R漫谈

  2. 2.     R的工作环境

  3. 3.     R的基本语法

  4. 4.     控制语句(条件和循环)

  5. 5.     使用及编写函数

  6. 6.     R的面向对象机制

  7. 7.     R语言编程的最佳实践经验

  8. 8.     最简单的制作R包的方法

2讲:R语言数学基础

  1. 1.     向量和矩阵

  2. 2.     线性代数与矩阵运算(行列式、矩阵操作、线性相关、逆、特征分解、SVD等)

  3. 3.     随机变量与分布(概率、随机变量、随机数、密度函数、分布函数等)

第二天

3讲:R语言数据操作

  1. 1.     数据的读入与写出

  2. 2.     文件的操作

  3. 3.     数据库操作

  4. 4.     常用数据处理函数

  5. 5.     数据处理神器:dplyr

  6. 6.     大数据的处理

4讲:统计模型

  1. 1.     线性回归及

  2. 2.     模型诊断及案例分析

  3. 3.     回归的扩展(非线性、Logistic回归、Lasso

  4. 4.     主成分分析和因子分析

  5. 5.     聚类分析和判别分析

  6. 6.     多维变量的探索

  7. 7.     时间序列简介

  8. 8.     蒙特卡洛方法简介

第三天

5讲:机器学习

  1. 1.     数据挖掘与机器学习

  2. 2.     无监督学习(关联规则、聚类分析)

  3. 3.     判别与分类

  4. 4.     分类算法简介(Logistic回归、决策树、SVM、随机森林、Boosting等)

  5. 5.     分类算法的评估与交叉验证

  6. 6.     深度学习的最新进展分享

6讲:数据可视化

1.  描述统计与统计图形简介

2.  R中的图形设备与作图方式

3.  常用图形参数介绍

4.  ggplot2简介

5.  动态可视化的示例和业界新进展

6.  数据关系的探索(散点图与相关分析、箱线图与因子析、

7.  马赛克图与列联表分析)

8.  数据分布的研究(直方图、QQ图、热图)


第七讲:现代分析技术的应用(选修)

  1. 1.     自然语言处理与文本挖掘

  2. 2.     社交网络分析

  3. 3.     空间数据的展示与地理信息分析

  4. 4.     图像分析技术简介

  5. 5.     最优化方法与运筹学简介

(培训采用案例教学方式,因选用案例较多,大纲中不一一罗列)

六、颁发证书

学员培训后经考核合格可获得全国通信和信息技术创新人才培养工程《数据挖掘与分析应用高级工程师》职业技术水平证书或代为申报国家工信部人才交流中心信息化工程师系列之《大数据工程师》技术水平证书,该证书表明持有者已通过相关培训和考核,具备相应的专业知识和专业技能。并作为聘用、任职、定级和晋升的重要参考依据,可网上查询验证,全国通用。

七、拟邀师资

李老师,毕业于北京大学,浙江大学软件学院兼职教授、华东师范大学硕士研究生导师,台北商业大学业界专业教师,曾任Mango Solutions(全球最大的R技术开发公司) 中国区数据总监,2015上海R语言大会主席,专注于数据科学在行业里的应用。2005年从事R语言相关研究,擅长R语言的工程开发与分析建模,是 Rweibo、Rwordseg、tmcn等 R 包的作者,著有《数据科学中的R语言》,翻译了《R语言核心技术手册》、《机器学习与R语言》,撰写过大量R语言的基础和高级应用类文章,从事R语言数据挖掘分析培训多年,探索出一套以案例讲解带动理论理解和软件操作熟悉的方法。

八、费用标准

培训费用3980元/人(含培训费、教材费、考试费、证书等相关费用),食宿统一安排,费用自理。

九、联系方式

联系电话:010-59024899       手机: 18618109420

联 系 人:孙老师             邮箱:2777641833@qq.com

 

 

附件二:报名表

R语言数据分析与挖掘核心技术研修班报名回执表

(经研究我单位选派以下同志参加此次学习)

单位名称


发票抬头


发票内容:□1、培训费 □2、会议费

联系人


电话


手机


参会人数:_    ____人

参会费用: _      ____元

付款方式:□1、现金 □2、刷卡

□3、银行转账

 

参加

人员

名单

 

 

 

姓名

职务

手 机

E-mail





















对课程内容设置的意见建议













联系人:孙老师  手机:18618109420   QQ:2777641833

注:名额有限!请确定参加人员从速报名,培训前7日我们将给您邮件发送《报到通知》,告知具体培训地点、乘车路线等事宜。

 
程序员之家 更多文章 作为一个程序员,熬夜有什么好炫耀的? 每一个程序员都是自学成才? 程序员找不到对象分几种情况? 简直了,程序员竟然还能这样选专业? 你好,麻烦问下你是程序员吗?
猜您喜欢 苹果2015漏洞多?然并卵 程序员最常用的十个 Mac 工具(上) 最新盗窃手法:ETC里的钱竟被POS机隔空刷光 一个简单的Python爬虫, 用于抓取豆瓣电影Top前100的电影的名称 UPYUN Open Talk : 同盾,从零打造千万级实时风控云服务