微信号:robbinthoughts

介绍:肉饼铺子作者robbin是前JavaEye网站创始人,现在是丁香园技术VP.robbin希望借助这个平台和大家分享互联网领域的想法、观点和经验,也希望借助这个平台认识更多互联网行业朋友,互相交流和学习.

大数据究竟有啥用?

2015-10-13 12:15 Willam Zhu
本文来自我的前下属William Zhu,可以作为一篇大数据的科普入门文章,告诉你大数据不仅仅是个“大词”,它实际上很可能对你的义务有实际用途。(文章内容有删节,查看原文请点击文章左下角“阅读原文”)
一家互联网公司组建一支大数据团队,支持大数据的开发,成本是不低的:

1、投入机器:会比传统的业务更消耗服务器,单机配置一般也比较高;

2、人员:BI、分析师、应用研发、架构算法,每种类型的人价格都不便宜;

3、数据为导向(或者慢慢转换为以数据为导向)会对原有的产品产生额外的负担:比如该产品需要产生大量的数据供大数据使用。

在实际的发展过程中,有很多老总敏锐的感觉到,手头有这么多有价值的数据,一定要利用起来,但是有几个问题确实是很多人不清楚的,大家也是边做边感受。有时候做到后面,心里也会犯嘀咕,花了这么多钱,这么多人手,做这件事情真的值得么?

我觉得真要做,至少要考虑下面几点:

1、需要多少成本?
2、需要多少时间?
3、产出是什么?
4、数据最后呈现的产品形态是什么?

如果能清楚的知道数据最后的产品呈现形态,想必产出也就自然而然知道了。毕竟产出需要特定产品去承载。 你知道了数据的最后的产品呈现形态,知道了产出,也就知道,数据究竟给公司带来了什么,也就回答了我们标题上的问题。

在罗列大数据都有哪些呈现形态的时候,我们不妨从一个非常高的角度看看大数据的组成包含哪些:

1、数据本身;
2、流水线(支撑数据分析的数据处理平台);
3、挖掘加工(分析数据内部特征关联性规律,也就是机器学习);
4、产品(最终的呈现形态)

目前产品呈现形态,我所知的有:
推荐
1、电商应用最广泛。有效增加用户体验,同时提升点击转化购买率;
3、有内容产出的站点。比如CSDN;
3、做内容聚合的,比如今日头条。据说今日头条的算法随着用户使用的积累,效果越来越好了。
广告(精准营销)
1、专业的广告公司,比如广告联盟;
2、特定产品本身承载的广告投放:比如微信那个高大上的朋友圈广告;
3、公司内部的EDM、电话、短信等营销
搜索(排序因子)
机器学习产生的很多中间结果可以有效的提升搜索的排序
用户分析
1、了解你的客户是根本;
2、金融行业非常依赖于此:比如信征,反作弊,反欺诈等,未来放贷的变革估计也靠此了;
3、这个可以作为一个直接的产品,也可以作为一个中间服务,直接支撑推荐,广告,搜索等产品
实时计算
流量计费,反欺诈/作弊等等都需要依赖于此
BI报表
1、基础流量,你网站的pv,uv等等;
2、质量监控,监控分析你的服务是否顺畅,比如视频播放卡顿比可以反馈出视频网站的服务质量;
3、运营监控,譬如通过情感分析可以得到用户的直观反馈。典型如京东评论的情感分析;
4、特定指标计算,这个是根据运营以及决策人员根据实际经验想看到的一些数据,我们把它量化,指标化,从而呈现出报表形态,方便运营以及决策人员做出相应的调整。
其实总结下,无非做了如下两件事情:

1、了解 自己的产品和用户;
2、提升 各种转化率和决策 的准确率。

那么对于大数据团队的实际作用,大家心里有一个基本认识了吗?
 
肉饼铺子 更多文章 对屌丝要抱有敬畏之心 封杀还是放任,这是个纠结的问题(一) 封杀还是放任,这是个纠结的问题(二) 封杀还是放任,这是个纠结的问题(三) 封杀还是放任,这是个纠结的问题:专家运营逻辑(四)
猜您喜欢 从IDC到云端架构迁移之路(GITC2016) 数据思维从娃娃抓起,利用体育运动分析讲解数学 软件开发不能用盖房子来比喻 我是一个垃圾程序员 【喜报】途牛又有多名员工获得发明专利奖励!