微信号:bigdatalab

介绍:宽客俱乐部旗下美国大数据实验室,大数据研究应用.

数据科学家的自我修养:数据科学课程清单

2016-04-05 08:08 大数据实验室

最近一年以来,大数据这个概念被吹嘘的天花乱坠,仿佛你要是不说大数据就落伍了。继云计算之后,大数据已然成为IT行业的热点。《哈佛商业评论》更是宣称“数据科学家”是二十一世纪最性感的职业。所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么。这里我不想重复什么是大数据,什么是数据科学,而是想以个人过去接近2年时间通过MOOC(开放课程)来学习数据科学的实践来给出一份个人建议的数据科学学习之路的课程清单。


数据科学家的自我修养

Drew Conway给出的数据科学的一个文氏图,很好的诠释了数据科学的技能要求。而这里我基于传统的道,术,用来将数据科学的课程分成三类在后面一一列出。不过还是让我们先从数据科学入门谈起。


数据科学入门

如果你公司的管理层,只是感觉想了解一下什么是大数据,个人建议从big data for performance这门课开始,课程有4个模块,很简单的内容,当然也有些不是很正确的内容;-),但作为入门还是不错的。接下来你需要了解一下Hadoop,来自Udacity的Intro to Hadoop and MapReduce是个不错的选择。


最后如果你要想忽悠一下别人,看看维克托•迈尔•舍恩伯格(Viktor Mayer-Schönberger)的大数据时代,这是国外大数据研究的先河之作。


如何利用大数据:数据科学之道

要掌握数据科学,基础的数学与统计学知识不可避免,这里强烈推荐:


普林斯顿大学,Statistics One(统计学基础),假设检验,ANOVA,线性回归等等


斯坦福大学,Statistics learning 基本的有监督学习介绍,回归,分类,聚类,树,SVM,K-means clustering等等。


这两门课都是名校教授讲解,课程深入浅出,一个帮助你统计学入门,一个帮助你数据分析与机器学习入门。不过如果你听统计学初步都觉得吃力,那么可以考虑先听一下台湾大学的概率论的前几讲,对概率有了初步知识后再学统计。


当然如果你想更深入一些你一定不能错过斯坦福大学的Machine Learning,这是Coursera创始人的经典课程。


除了以上课程,你也可以看看约翰霍普金斯大学5月开设的3门课程:
Statistical Inference
Practical Machine Learning

Regression Models

当然Edx,Coursera也是寻找相关课程的好地方~


数据科学之术

有了数据科学之道,我们下一步需要进行的就是如何实现它了,有人推荐Python,也有人推荐R,或者来自Apache的mahout,个人推荐Python+R,于是你可以看看:

莱斯大学的An Introduction to Interactive Programming in Python

华盛顿大学的High Performance Scientific Computing

约翰霍普金斯大学的R Programming


之前约翰霍普金斯大学还开过:

Computing for data analysis

data analysis


了解了R,Python,下一步就是大名鼎鼎的Hadoop生态系统了,Udacity上的Intro to Hadoop and MapReduce是不错的入门选择,之后IBM 的大数据大学上的Hadoop,云计算,课程也是不错的选择。


数据科学之用

一切技术最终都要回归商业的本质,掌握了数据科学之道和数据科学之术,我们还需要将其应用于商业中。这里首当其冲的就是如何把从数据中解读的智慧表达出来,说服别人,这里要推荐来自密歇根大学的Introduction to Public Speaking。这门课可以帮助你更好的组织你的讲演,演示等(目前这门课正在开课中)。


除了表达能力,很多时候我们的数据不是单纯的数据,我们需要理解数据分析与公司战略的关系,如果我们要开发数据产品,那么它是如何影响我们的运营,财务决策的,当然最终所有的一切都会受到宏观经济的影响,以下的几门课程可以帮助你更好的理解数据之用:

马里兰大学 Developing Innovative Ideas for New Companies

弗吉尼亚大学Foundations of Business Strategy

加州大学The Power of Macroeconomics

清华大学财务分析与决策

宾夕法尼亚大学An Introduction to Operations Management


最后我要推荐Data Science for Business这本书,这本书将数据科学之道与用完美结合,亚马逊上五星评价!


其它资源

除了以上列出的课程,你也可以参考:

coursera上约翰霍普金斯大学的数据科学专业课程 data sicence。一共9门课,目前每个月都在开课。

来自网络上的数据科学硕士开发课程清单

以及学堂网收集的数据科学课程


(作者:机器人_35246           来源:MOOC





2016年4月15日、16日,上海


春末巨献,股票实战培训班报名啦
与大师面对面,传授稳定盈利秘籍


咨询电话/微信:13061694649




 
大数据实验室 更多文章 用户画像数据建模方法 李光斗:警方是如何利用大数据抓到王全安的 降楼价,新加坡居然靠的是无人驾驶! 小数法则和经验主义 什么性格的人适合 Quant 这个职位?能否描述一下 Quant 一天的生活是怎样的?
猜您喜欢 React Native 开发之 IDE 选型和配置 用Golang写一个搜索引擎(0x09) 携程Docker实践 别让无节操的APP拖累了你的Andriod! 详细了解 Android Context