微信号:programmer_club

介绍:程序员第一自媒体,与你探讨码农人生路上遇到的各类泛技术话题,定期为你推荐码农人生思考、感悟以及启迪!

爬了100万码农招聘需求,我竟发现这些技能最值钱!

2017-07-29 21:59 文若、勃勃

作者:文若、勃勃

来源:51cto

链接:http://news.51cto.com/art/201707/545617.htm

现在流行这么一句话:“找工作的时候,只有两种专业——计算机系的和非计算机系的。”这些年,选择了计算机系的人都在虐人模式的人生游戏里开挂,而非计算机系的人则在被虐模式里挣扎。



可是你注意到了吗?即使是同为计算机专业的人,薪酬待遇也有高低差别。

计算机方向不同行业的薪酬价值,各大招聘网站每天写来写去,想必大家都看烦了。今天想和大家聊聊不同的东西——抛开物质回报不谈,身为码农的你,在工作中积累的各种技能,究竟值多少钱?

从招聘需求中挖掘技能价值

从招聘网站上爬取了 100 多万条有关计算机专业的职位招聘文本,每条文本主包含职位工资和职位要求。我们要做的是从文本中识别“技能”,然后将其和职位工资关联起来。

为了从职位要求描述中抽取技能,我们采用 weak-supervised learning 的方法。

我们首先对职位招聘文本进行句法分析,生成一个粗略的职位技能集合,这个集合是满足语义树正则表达式的所有名词或动名词短语。

然后进行少量的人工标注建立训练集,采用 BiLSTM 的实体识别模型对招聘要求描述中的技能进行识别和抽取。

最后不断迭代“标注-训练-预测”这个过程,优化识别结果。

算法框架如图所示:

图一

最后,将抽取的技能实体和职位工资关联,并人工分为了几组。下面让我们看看每一组技能价值的结果吧。

PHP 是最好的语言?

好吧,这其实是一个广为流传的笑话。说是有三个程序员坐在格子间里编程。第一个程序员一言不发。第二个程序员写一会儿就按一下编译,然后就玩会儿手机。

第三个程序员坐在那里浏览网页,不时飞快的键入一些字符,看起来不怎么干活,尽在上网。请问,他们分别是用的什么语言?

图二

言归正传,学会各种编程语言究竟能给你增加多少身价?

我们的文本挖掘结果显示,排名第一的编程语言是 Scala,价值 17.68k,而最后一名是 C 语言,仅有 9.46k,是Scala的一半多一点。

Scala 作为大数据处理、建模的函数式语言,之所以这么值钱,主要源于前些年大数据产业的爆发。但随着近几年大数据产业重归理性,以及 Scala 人才数量的增加,其价值也会逐渐回归到正常价值。

还有一个在数据挖掘领域讨论比较激烈的话题是,我该学 Python 还是学 R?

文本挖掘结果显示,Python 的价值比 R 高出 30%。这可能是由于,在近年来越来越火的人工智能领域里,很多算法框架都优先支持 Python,从而导致 Python 的价值逐年升高。所以,如果是初入数据分析行业,还是学 Python 吧。

其他的处座就不一一分析了,反正除了 PHP,你们都是最好的语言……

码农生存工具鄙视链

聊完了编程语言,我们再聊聊码农们赖以生存的开发工具。

如今,做移动应用的码农要使用 Recat Native、Weex、Cordova 或者 Ionic 等框架;做深度学习的算法工程师要使用 keras、theano 或者 tensorflow 等框架;做项目管理的架构师要使用 word、excel 和 ppt 等。

那么,不同的开发工具,在价值上有多大的差别呢?

图三

分析结果显示,排名前三的工具分别是 keras、theano 和 tensorflow,其价值分别达到了 45k、29.29k 和 26.71k,在码农生存工具鄙视链上远远超过其他工具。

随着人工智能概念的火爆和深度学习人才的稀缺,掌握这三款用来进行深度学习建模的框架,对码农个人价值的提升是极大的。

当然,从另一个角度来看,这不合理的差距,也说明了深度学习产业存在泡沫。作为深度学习的算法工程师,也当居安思危,多掌握一些其他的工具框架,以应对泡沫破灭的到来。

另一个有趣的点是处于码农生存工具鄙视链最底端的办公三兄弟 word、excel 和 ppt。

十年前有一句老话说:写 word 的不如写 excel 的,写 excel 的不如写 ppt 的,写 ppt 的不如讲 ppt 的,讲 ppt 的不如听 ppt 的……

从鄙视链上来看,确实如此,ppt 技能价值 8.36k,excel 技能价值 8.05k,而 word 技能仅价值 7.30k。

在这一节的最后,处座想说,其实生存工具鄙视链并不应该存在,做深度学习的并不优于做移动开发的。这不过是因为技术的发展和经济结构的转型而造成的误会而已。

有人曾感叹:“现在在公司的格子间里面哼哧哼哧做 ppt 的那些人,和当年踩着缝纫机的女工们,其实没有本质的区别。”

是的,没有本质的区别,而我们的表现并没有优于我们的父母,这一切都不过是经济结构转型造成的生存工具的变化而已。

哦,不,还是有区别的。起码纺织工做完一个成品以后,可不会被关到一个小房间里,投到一个大屏幕上,然后让一群人围着羞辱你……

学子们该如何选专业?

计算机专业出身的学生有很多方向可以选择(你在问为什么只说计算机?请重读本文第一句话)——计算机硬件、大数据、人工智能、互联网开发。下面处座列出了这四个方向技能树价值,供学子们选专业时参考。

计算机硬件技能价值表

图四

大数据技能价值表

图五

互联网开发技能价值表

图六

人工智能技能价值表

图七

最后,希望这篇文章对于处在人生节点的你能有所帮助,愿你能活在自己的节奏里,修炼内功,点好自己的技能树,让自身越来越有价值。


作者简介

文若

Gammar Lab成员

自然语言处理爱好者一枚,致力于将人工智能技术应用于金融领域。

勃勃

Gammar Lab成员

麻省理工博士,爱好讲故事的算法工程师,擅长金融+人工智能产品研发。


 




在微信公众号内回复数字“1”

小编拉你进粉丝微信群

不是在文章评论里回

 
程序员之家 更多文章 如何练习一万小时? 百万年薪的人才泡沫?关于程序员向AI转型的事儿,这几位老司机是这么说的 周鸿祎:很多程序员一看就知道不会创业 以撩妹为例,5分钟让你秒懂深度学习! 为什么你说“就差一个码农了”,我们是拒绝的
猜您喜欢 Go 性能优化技巧 10\/10 微信小程序自动化实践 转角遇到爱-企业文化墙再设计 探索skynet(四):服务之间的通信 Android混淆的故事