微信号:infoqchina

介绍:有内容的技术社区媒体

第三只眼:数据科学家

2014-02-11 17:10 包研

在上一期的“第三只眼”,我提到了数据科学家这一新兴的职业。在Yahoo、Google、Facebook诞生了第一批数据科学家,尽管可能并不以数据科学家称呼他们。

Jeff Hammerbacher是第一个在Facebook被推上数据科学家的角色的。他在华尔街做过利率预测模型,有编程基础,大学学习数学,综合这些经历恐怕是他被认可的原因。

Jeff Hammerbacher和他的团队的工作也时时刻刻和他们夸多个领域的经验相关,每个人的工作跨度非常大,比如在任意给定的一天,团队的一个成员可以用Python实现一个多阶段的处理管道流、设计假设检验、用工具R在数据样本上执行回归测试、在Hadoop上为数据密集型产品或服务设计和实现算法,或者把分析的结果以清晰简洁的方式展示给企业的其他成员。

在工业界,没有比金融行业利用大数据更广泛的了。金融行业创造了数据分析专家(Quants),他们的工作是通过分析历史市场的行为数据,开发新的产品模型。无论在大型互联网公司,还是工业界,数据科学家都需要跨界的技能和经验。

Jeff Hammerbacher《数据之美》章节结尾处表示:Facebook构建的信息平台采用的硬件和软件将会迅速变化,数据科学家需要掌握的技术也将以同样的速度变化。保持致力于加速学习过程的目标对于企业组织和科学都有帮助。未来属于数据科学家。

英特尔中国研究院首席工程师吴甘沙曾表示,Spark和BDAS(Berkeley Data Analytics Stack)就是很好的大数据工具。随着大数据工具的发展,数据挖掘工作效率大大提升。熟练的使用这些工具就成为数据科学家必备的技能之一。

另一方面,针对没有编程基础的人,如记者、企业管理者,数据科学家开发了许多大数据分析平台,通过简单的鼠标操作就能获得有价值的信息。如斯坦福大学开发了在线文本分析网站etcML,通过分类器获得文本蕴含的情绪、热点事件。用户还可以训练和分享自己的分类器。

也许,不久的将来每个人都能成为一名数据科学家,就像使用搜索引擎或维基百科查找资料一样,通过大数据工具分析购买汽车一年中最佳的时间;通过社交平台分析自己或朋友的情绪变化,推荐适合娱乐方式或话题;预测3-5年后的热点行业,提前学习做储备。


“第三只眼”:

主要由InfoQ编辑专门为微信公众账号自编自写的一个栏目,旨在表明编辑态度及表述平日见闻和思考,期望成为和读者沟通的桥梁。亦接受投稿:editors@cn.infoq.com


今日专栏作者:

包子(@Tony包研),InfoQ高级策划编辑,敲键盘,非代码,爱自由。


***********************************

本文来自InfoQ微信公众账号:infoqchina

1、回复“今日新闻”,查看今天更新的新闻;

2、回复“今日英文”,查看今天英文站的更新;

3、回复“文章 +关键词”,搜索关键词相关内容;

4、回复“QCon”,了解QCon大会相关信息;

5、回复“活动”,了解最近InfoQ组织的线下沙龙;

6、回复“架构师”,获取《架构师》下载地址;

7、回复“投稿”,了解投稿和加入编辑团队的流程。

***********************************

 
InfoQ 更多文章 Facebook如何实现PB级别数据库自动化备份 学术派Google软件工程师Matt Welsh谈移动开发趋势 Spotify为什么要使用一些“无聊”的技术? 妹纸们放假了,汉纸们做啥? 大多数重构可以避免
猜您喜欢 一切吐槽IOS 9字体的行为都是耍流氓 一篇文章入门Python生态系统 一款快速生成代码的Xcode插件FastStub Kubernetes In Rancher Linux Process States 与Systrace 中thread states