微信号:ai-front

介绍:面向AI爱好者、开发者和科学家,提供最新最全AI领域技术资讯、一线业界实践案例、搜罗整理业界技术分享干货、最新AI论文解读。每周一节技术分享公开课,助力你全面拥抱人工智能技术。

除了机器学习,你还应该学会这些技能

2017-11-16 18:00 实用主义
作者 | Vladimir Novakovski, Shivam Kohli
译者 | 张斌
编辑 | Vincent
AI 前线导语:著名问答社交平台 Quora 上有人就机器学习提出了这样一个问题: 截止 2017,关于机器学习,哪些技能或知识对包括研究职位在内的行业来说是最有价值的? 有两位在该领域较有经验的答主给出了他们的答案,希望能够帮助到有同样疑惑的你。

更多干货内容请关注微信公众号“AI 前线”(ID:ai-front)
回答 1:

最有价值的贡献者通常是通才。特别是在 2017 年,围绕特殊的机器学习方法有很多大肆炒作。很多求职者在网上学习一些深度学习的课程,并申请一些职位, 这让我想起网络炒作同样厉害的 20 世纪 90 年代,很多人不去读计算机科学教材,而是去读一些号称《20 天学会 VBScript》的速成书籍。依旧重要的技能包括:

(a)了解统计学、优化、建立量化模型的基本原理 ;

(b)了解模型和数据分析是如何实际应用到产品和业务中的。

除此之外,以下几点在 2017 年也至关重要:

  • 知道如何编写高质量的软件。一个团队编写质量垃圾的软件,然后另一个团队负责完善的时代已经过去了。使用 Python 和 R 这样的编程语言和它们的软件包,可以轻松处理数据和模型,因此数据科学家和机器学习工程师应该能够具备较高水平的编程能力,并了解系统设计的基础知识。

  • 使用大型数据集。虽然“大数据”这个术语使用的太过频繁,但数据存储的成本确实呈急剧下降趋势。这意味着有愈来愈多来自不同领域的数据集可以处理和应用模型。

是的,一旦你对一些知识有基本的理解和相应的技术水平后,了解至少一个热门领域(如用于计算机视觉和感知的深度学习、推荐引擎、NLP),将会对你很有用。

关于回答者

Vladimir Novakovski 从 2012 到 2014 年,组建了 Quora 机器学习小组。

回答 2:
技能#1:编程

这可能是数据科学家必备的最根本技能。数据科学家的工作比传统的统计学家更加实际。编程在许多方面都很重要,其中包括以下三点:

编程能够增强你统计数据的能力。如果你有一堆统计知识,但却没有办法实现它,那么你的统计知识就不那么有用了。

分析大型数据集的能力。你在业界所使用的数据集并不像 iris 样本数据集那么小可爱,你能轻松获得数以百万行甚至更多的数据。

您可以创建工具来更好地开展数据科学工作。这包括你的公司建立数据的可视化系统,创建自动分析实验的框架,以及管理公司的数据流水线,以便随时随地获得所需的数据。

技能#2:定量分析

定量分析是数据科学家的核心技能。数据科学的大部分内容是通过分析自然科学和实验所产生的数据来理解一个特别复杂的科学系统的行为。定量分析技能在许多方面都很重要,包括以下三点:

实验设计和分析:特别是从事消费互联网应用工作的数据科学家 - 数据记录的方式和实验的运行方式,为大量的实验来测试各种假设让路。实验分析很可能出错(你可以询问任何统计学家),所以数据科学家可以提供很多帮助。

复杂型经济 / 增长系统建模:经典的模型在这里是常见的,如客户流失模型或客户终身价值模型。更复杂的模型,如供应和需求建模、匹配供应商和供应商的经济最优方法,以及建模公司的增长渠道,来更好地量化分析哪些增长途径最有价值。最著名的例子是 Uber 的价格飙升。

机器学习:即使没有实现机器学习模型,对于数据科学家来说,他们也可以帮助创建原型以测试假设、选择和创造功能,以及判定现有机器学习系统中的优势和机会。

哪些数据科学领域的人员对这项技能最有需求呢?

1、物理学家

2、统计学家

3、经济学家

4、运筹学家

5、还有很多其他人,他们非常习惯通过自上而下的方法(建模)或自下而上的方法(数据推断)来理解复杂的系统。

技能#3:产品直觉

作为一种技能,产品直觉与数据科学家对系统进行定量分析的能力有关。产品知识意味着要理解生成科学家们所分析的所有数据的复杂系统。这之所以是非常重要的,原因很多,其中包括:

产生假设:一个非常了解产品的数据科学家可以用一种特定方式来改变产品的行为方式。假设是基于“预感”,关于系统的某些方面如何表现,并且你需要知道系统能够对“它是如何工作的”有预感。

定义指标:传统的分析技能集包括确定公司可用于跟踪特定目标是否成功的主要和次要指标。数据科学家需要了解产品,以便创建产品指标来 1、衡量意图,2、衡量可以往前推进的东西。

调试分析:“难以置信”的结果通常是由 bug 而非系统实际“难以置信”的特征引起的。良好的产品知识有助于快速进行全面检查和粗略的计算,帮助我们更快地识别可能出错的东西。

产品知识通常包括使用您公司正在创造的产品。如果这不可能的话,至少要试着了解那些实际使用该产品的人。

技能#4:沟通

这个技能很重要,有助于提高上述所有技能的影响力。这个技能特别重要,有助于区分好的数据科学家和伟大的数据科学家。良好的沟通能以通过各种方式来表现,其中包括:

沟通见解:一些数据科学家称之为“讲故事”。这里重要的是以清晰、简明和有效的方式交流见解,使公司中的其他人能够有效地按照这些见解采取行动。

数据可视化和呈现:有时,在表达或传达观点时,什么都不如一幅清楚明晰的图表。

总体沟通:作为数据科学家,几乎总是意味着作为一个团队来工作,包括与工程师、设计师,产品经理、运营人员等一起工作。良好的总体沟通有助于促进信任和理解,这对于被委托管理数据的人来说是非常重要的。

技能#5:团队合作

这最后一项技能将其余四项技能结合在了一起。特别是数据科学家不能孤立存在。据我的了解,数据科学家在深入到公司其它部门时(或至少深入到产品开发组织),就能做得最好。

团队合作之所以重要,原因有很多,其中包括:

无私:这包括为他人提供帮助和指导,并将公司的使命放在自己的个人职业生涯的野心之上。

不断的迭代:数据科学家重视反馈,他们的大部分工作都需要与其他人进行反复迭代和反馈,以达成有影响力的解决方案。

与他人分享知识:由于数据科学家是新出现的职业,基本上没有人拥有完整的技能,特别是当你收集所有可能有用的统计技术、框架、库、语言和工具时。由于知识将发散在数据科学家及其组织当中,因此对于数据科学家来说,不断分享他们的知识、方法和结果是特别有用的。

关于回答者

Shivam Kohli, 印度斯坦时报前数据工程实习生 Shivam Kohliz

查看英文原文

https://www.quora.com/As-of-2017-what-set-of-skills-or-knowledge-pertaining-to-machine-learning-are-most-valuable-to-the-industry-including-research-positions/



 
AI前线 更多文章 Geffory Hinton的“胶囊”里到底装的什么“药”? AI一周热闻盘点:亚马逊宣布支持ONNX;科技部公布首批国家人工智能开放创新平台名单 论文导读 | 一点微小的扰动,就可能导致深度神经网络做出错误判断 准确率99%!基于深度学习的二进制恶意样本检测 大数据查询——HBase读写设计与实践
猜您喜欢 正益2016年宣传视频:云-端-创变,畅想移动工作&生活新场景 波士顿动力那只跌倒后可以爬起来的机器人,刚刚完成了两个完美后空翻! 你信吗?微软也会“耍流氓”!近日部分用户已被强制升级至Win10 Rancher使用入门 一个小巧好用的Android引导蒙版(浮层)库