微信号:BigdataTina2016

介绍:专注大数据和机器学习,每天发布高质量文章,技术案例等原创干货源源不断.大数据社区组建中,在这里与志同道合的朋友分享前沿技术,交流深度思考.我们等你来!

专访LinkedIn李海鹏:数据驱动产品,不靠技术靠人才

2016-05-03 21:06 大数据杂谈

技术变化太快,数据驱动正在改变着招聘方式甚至是业务方式?来看看招聘卖画为生的艺术家,创造数据产品驱动商业价值的李海鹏是怎么说的。

Q:现在有一种趋势,很多公司的招聘已经倾向于在GitHub上面寻找人才,而不单单依靠简历形式。请问这种招聘方式会给LinkedIn带来哪些影响?

李海鹏:这是非常好的一个方向,LinkedIn做的事情是一个平台,我们的愿景是为全球的职场人士提供服务。这两者并不是冲突,而是更加融合的过程。我也看到越来越多的程序员也愿意把自己的GitHub项目放到LinkedIn上面做展示。

从垂直面的领域角度来讲,LinkedIn平台跟垂直招聘细化会并行。所以我觉得这是一个很好的趋势,能够更多的帮助公司找到更好的程序员。因为原来通过面试这个很短暂的过程,很难发掘一个人的所有潜力。从公司角度来看两者是相辅相成的关系。

Q:作为LinkedIn的数据产品经理,您招团队的时候觉得团队成员必须具备哪些技能?

李海鹏:这是个比较好的问题,首先我不能算产品经理,我带团队做很多类似的开发,我招人相对来说不拘一格,因为在我看来想做好数据应用和数据产品需要一个很丰富的知识,就像要懂得一些商业,要懂得数据的处理方式,更要懂得理念。

分享一个很有意思的案例,我过去曾经招过一个艺术家,是真正的艺术家,不是所谓的文艺青年,我团队这位艺术家有一段时间是靠卖画为生的,从逻辑上看完全跟左脑右脑有区别。用传统的招聘方式是不可能把这样的人招聘到团队里来的。我更看重的是他快速学习能力和他的热情。

技术变迁真的很快,如果按照过去的技能去招聘的话永远是赶不上变新的翅膀,会落后于这个时代。所以需要更看重他有没有快速的学习能力和热情。像我招聘的这位艺术家非常成功,给公司创造非常多的价值。

Q:现在国内外有很多数据驱动的公司,包括创业公司,都在讲数据驱动的概念,但是感觉有点务虚,我们认为LinkedIn做得比较成功,从您的角度来讲LinkedIn为什么能够落地,而且有这样的优势?

李海鹏:从几个方面去想,第一个,很多公司说是数据驱动的公司,但是它的决策和决定并不是数据驱动的,像LinkedIn的CEO,他每天起来会看很多公司的KPI,这样自上而下的数据驱动的思维方式,能够让公司在数据应用方面更加好。

第二点,看不同的行业和不同的团队和公司处在阶段,比如O2O这样的行业市场竞争非常激烈,根本没有那么多时间真正挖掘它现有数据的价值,所以它最后没有办法去做到数据驱动。

另外,我看到有一个比较有意思的事情,就是我们看到硅谷和中国这些创业公司的对比,是两个极端,一边是技术驱动,一边是业务驱动。完全两个极端的公司都做得不好,一定要在中间找个平衡点。

硅谷的公司相对更偏向于平衡点,更偏向于技术驱动,而中国的公司更多以业务驱动,以业务驱动经常是KPI驱动的,很多时候迫使放弃很多能力,因为你要很快的把这个结果进行交付。像销售方面的东西,如果是技术驱动的公司,愿意花很多时间和精力去提高销售职能,但是如果是业务驱动的公司,最简单的办法是多招一些销售人员和做更多地推来达到KPI,这两种不同的公司文化也是其中的一部分原因。

不光是Linkedln,硅谷很多公司把自己作为一个技术公司来定位,这样数据驱动的能力能够和技术结合得更加得好,要做到一个很好的平衡,而不是一方过于主导另一方。

Q:对于一些普通的公司来说,数据驱动业务,然后业务支持数据,挖掘公司数据的价值,您觉得比较难的环节是什么地方?

李海鹏:比较难的环节其实是在人才,我们在硅谷也深有感触,人才永远是公司的核心竞争力。

不同的人才流动会造成你公司排名或者产品很大的差别,这是第一点,人才上面的缺失。第二点,对很多数据挖掘的经验和理解,我个人可以分享一些我理解的方式,原来我们过多的偏重于算法本身或者挖掘技术本身,这个算法比那个算法快,那个算法比这个算法牛,实际这是非常错误的,太过于技术极端,而没有和业务、商业线结合起来。

假如你这个架构都没有在你做数据时候就加进来,因为你完全跟业务线脱离,那你这个模型是不可能做到非常好的效果。

举个简单的例子,之前在美国面试一个人,他在游戏公司里面做一个事情,玩游戏有小号,做一些对你比较有益或者对平台不是那么有益的活动,他的工作是把这些小号找出来。他跟我讲了特别多的算法,我听得云里雾里。我后来问他数据的架构,问他有没有从密码着手,可能大号小号的密码很相似,当你发现你用了一个正确的数据,不需要用特别复杂的算法,也能够把这个事情做得特别好。

所以对于数据挖掘来讲,太多人注重于算法本身,而没有注重怎么把算法和业务线结合起来,找到对你有帮助的数据。

Q:对于数据驱动业务,如何区分自然业务的增长和数据驱动业务增长这两个部分?有没有什么比较好的方法或者标准验证它?

李海鹏:自然业务的增长,很多硅谷公司采取的都是像AB测试,严重就能够把新的架构和通过数据做出来决定的效果做个AB的对比,知道哪些是增长。互联网公司这套相对来说简单易用的ABtest的流程的话,这个对公司帮助是很大的。

Q:国内在AB测试方面没有应用那么广,大的互联网公司会用。

李海鹏:很多人觉得我是一个非常小的公司,现在可能用户也没那么多,做AB测试没有办法达到统计意义,所以觉得做了也没用。但是发现很多公司上线一个功能,网站就宕了。

像硅谷不光是LinkedIn,任何一个公司都有非常庞大的AB测试,因为我们用户数量极大。同时在线运行的ABTEST可能每天有几万个在同样的网站上运行,可以通过它的指标和KPI做一个非常好的决定,这就是我们所谓的数据驱动。很多公司连这个功能都没有,那它怎么做这个数据驱动。

所以互联网公司的AB测试概念或者简易流程还没有的话,它很难去做真正的数据驱动。

Q:目前LinkedIn有没有数据产品推出的计划?

李海鹏:LinkedIn作为一个公司,每次推出的产品都是以数据为主的数据产品,包括从招聘解决方案到营销解决方案、到销售解决方案,到最后会有一个学习解决方案,后续会推出这样的产品和服务,具体时间只能等待公司的发布,但是我希望这个产品能够帮助更多大学习到更多技能和知识,让他们在职场上更加进步。

Q:这个产品会采用哪些比较前沿的技术进行产品的开发?

李海鹏:比如在我们的数据驱动技术框架里,我不觉得作为数据的应用或者数据的产品是前沿技术应用的过程,我觉得更多的是把商业数据和工程相辅相成,互相达到一个水到渠成的融会贯通的能力。

我们开发一些新的数据产品的时候,没有特意去想一定要用什么新的技术,或者这个新的技术一定对我们有多么大的帮助,更多的是从业务角度、从用户本身找出来这个价值。在我看来,因为我们已经有非常强的数据的架构和数据的团队,所以可能不见得会有特别多更新的技术。

Q:您对数据驱动行业的前景以及技术趋势有什么看法?

李海鹏:这个要分层级来看,首先从最底层来看,我个人看来是两个极端,一个是传统的,里面有很多好的东西,另外一块可能很多东西都没有,用的最笨的方法,因为集群比较大,所以把它算出来。现在会慢慢由原来的单机优化到Hadoop集群上来,把两者的优势发挥得淋漓尽致,这是我看到的一个趋势。

另外一个趋势,我自己认为随着数据越来越多的媒体化,这个概念就是原来我们看数据很多时候是以数字或者文本为主。到今天随着生活多样化的变化,很多照片或者视频的数据应用会越来越广,以后肯定有越来越多类似的出来,像Google人工智能这种框架,对于处理类似照片和视频这个艰难的工作是非常好的,以后相对专业一些的会越来越多。

大数据杂谈 

ID:BigdataTina2016


▲长按二维码识别关注

专注大数据和机器学习,

分享前沿技术,交流深度思考。

关注加入社区!

 
大数据杂谈 更多文章 Hadoop之父给黄色小象的十岁生日祝词 点击模型:提升算法精度的利器 看巨头公司如何拥抱大数据 案例 | 金融行业数据挖掘之道 原创 | H2O.ai首席架构师的深度学习面面观
猜您喜欢 “大姨吗”创始人用4个故事——告诉你“慢就是快” 大型分布式系统架构实践案例的分享——Apache Eagle 原创 | 人工智能革命探秘 • 上篇 黑科技,Python 脚本帮你找出微信上删除你好友的人 Ray Wenderlich 的 Objective-C编码规范