微信号:bigdatalab

介绍:宽客俱乐部旗下美国大数据实验室,大数据研究应用.

美女怎么利用大数据:如何在魔都捕获一只活的高富帅?

2015-12-09 08:48 大数据实验室

考上市里的公务员后,学姐的人生目标已完成大半。但一直以来,她还有一个更为伟大的愿望:嫁入豪门,一步登天。但这个愿望似乎比考公务员更难实现。我经常听到她的抱怨:


好累啊,找来找去碰到的都是些伪豪门。要找一个真正的高富帅怎么就那么难呢?


看着学姐日益憔悴的面容和猩红色的眼睛,我决定用上次那组研究公务员加班的那组数据再来帮助她一次。


于是我问学姐:你心目中的高富帅是什么样的呢?


学姐说:首先,高富帅得住豪宅啊。我问:那豪宅怎么定义呢?学姐说:住宅的话,起码得6万一平吧。你想想,现在魔都6万以下的房子能住吗?要么地理区位不行、要么建筑立面不行、要么物业配套不行、要么邻居素质不行。这种小区,你好意思带姐妹们回家做客吗?当然,假如是外派来上海的高帅富的话,常年住五星级酒店和高级酒店式公寓的也凑合吧。


忍住吐槽,按照学姐的要求,我查了一下上海所有房价均价均价在6万元/平方以上的一手房,再加上五星级酒店和酒店式公寓,共计有70个高档住宅小区和150个酒店,落在魔都地图上大概长这样:




在这些地点的范围内,我们再对上次公务员加班研究用过第三方移动数据进行地理筛选,可以找到半年内在夜间(0:00到6:00)高频出现的移动热点。我们将其理解为常住在这些豪宅和五星级酒店里的群体。当然也包括了小区保安和酒店服务人员。不要紧,学姐还有新的需求。


学姐又说:光住豪宅也不行。高帅富得有好工作。我不喜欢纯富二代,不上进;我也不喜欢小老板,不大气;我更不喜欢土财主,不体面。我要的高富帅,起码得在大型知名企业当个高层什么的,一呼百应、万众瞩目、出入都是顶级写字楼,这样我中午去送便当的时候也能够更有面子啊。


再次忍住吐槽,按照学姐的新要求,我们再选出大型知名企业(我设定为2014年给上海市纳税超过10亿元的企业,够大型了吗?连上交所都没达到这个级别呢),再筛选出全上海租金top20的顶级写字楼。共计50个企业和20幢写字楼。落在地图上大概长这样:




在这些地点的范围内,我们再对第三方移动数据进行地理筛选。可以找到半年内在日间(9:00到18:00)高频出现的移动热点。我们将其理解为在这些大型企业和高级写字楼里工作的群体。毫无疑问,金融界的高富帅最多,而最密集的地区自然是上海的金融业CBD啦。主要是陆家嘴,然后外滩和北外滩也有若干地区。


然后,我们将这两组样本取交集运算(这下保安和服务员就可以被排除出去了)。落在地图上大概长这样:




这些应该是满足学姐要求的真正的高富帅所在之地了吧。学姐,快打扮打扮向这些地点进发吧!


但是,学姐提出了一个深刻的问题:


地点没错,但这两个时间段都不好,毕竟夜里人家的家我也没法进去,白天时候又不好去打扰别人工作。我们还得看他们的休闲消费时间都去哪才行吧。


看来学姐的确深思熟虑。那么回到刚才那组样本,找到其半年内在傍晚(18:00~22:00)休闲时段内的高频地点,然后对比其和日间及夜间地址的关系,得到下图:




可以看到,根据其傍晚的行为习惯,魔都的高富帅可以分为三种:


1、按时回家的高富帅。占比约38%。(这是不是上海的特色呢?)


2、激烈加班的高富帅。占比约37%。原来当高富帅也是很辛苦的呢!或者说,正因为努力地加班,他们才成为了高富帅?(呃,对了,由于高端写字楼密集的地方通常也是高端商圈的所在地,我们其实无法判断高富帅是真的在加班还是“楼上工作楼下消费”。不过,对高富帅来说,可能消费也是工作的重要部分呢。因此我们姑且认为这是一群兢兢业业日夜劳作努力为上海创造税收的高富帅吧。)


3、行动不明的高富帅。占比约25%。他们下班之后既不在家也不在公司附近。(这些是不是最有可能被邂逅的群体?)


还没等我深入挖掘,学姐已经把优盘插入了我的电脑:太好了,把汇总数据都拷给我,我要去制订一个计划出来。


不得不承认,学姐是一个行动力很强的人。


一天之后,她又来了,并且带着一份详细的报告。




魔都“高帅富”捕获计划


PlanA


捕获对象:行动不明的高富帅(占比数量25%)。


捕获地点:傍晚高频出没区。除了人民广场旁边的来福士广场、金茂大厦、中山公园-龙之梦等少数地方高富帅较为密集以外,其他多个地方也都有高富帅零星分布。具体位置如图所示:




捕获时间:傍晚消费时段(18:00~22:00)


捕获模式:在散落的分布中寻找重点,守株待兔、制造邂逅、寻找机会。


“帅哥你在等人吗?”“没有,我一个人。”“呵呵。”


从而实施捕获。


优点:方法简单易行,技术含量低。


缺点:隐藏成本较高。以上地点都是高级商圈,喝杯水都很贵。很可能钱包空了也没捕获上一个高富帅。大晚上的地铁一停运,还得走夜路回家。


PlanB


捕获对象:行动不明的高富帅(占比数量25%)。


捕获地点:高帅富下班路上。通过锁定高富帅们高频居住、工作和消费的地点,可以推断出其移动轨迹。通过样本高频点之间的连线,绘制出高帅富们的行动路径,具体路线请看下图:




捕获时间:下班高峰时段(18:00~20:00)


捕获模式:搭讪开着车的高富帅。由于高富帅们的活动范围大多在市中心,可以推测他们大多逃不过堵车的命运。换言之,只要下班高峰期在中心城区的大马路边晃悠晃悠,总能遇上那么几个堵车的高富帅。


“帅哥,你是去XX方向的么?……这么巧我也是!我的保时捷昨天被人追尾了,可以跟你搭个车么?”


从而实施捕获。


优点:可通过车辆水平进一步锁定目标。


缺点:容易触发交通事故。


PlanC


捕获对象:激烈加班的高富帅(占比数量37%)。


捕获地点:高帅富加班地点。包括环球中心、国金、各种金融中心和银行大厦、静安寺地铁站附近、恒隆广场、新天地、688广场等地都是加班高富帅的重要集散地。尤其以陆家嘴最为集中。具体地点如下图所示:




捕获时间:全天(8:00~20:00)。


捕获模式:保持继续学习状态,培养良好的业务能力和心理素质,比翼提高IQ、EQ,抽空可能还需要去趟韩国——然后进入这些高大上的公司,成为高富帅的同事,跟高富帅一起加班,在加班中升华彼此感情。


“让你陪我加班加到这么晚真不好意思,不如我送你回家吧。”


从而实施捕获。


优点:该类高富帅有理想有追求,综合价值高,同时其位置相对固定,易于捕获。


缺点:太难了做不到。




看到敬爱的学姐制定了一个如此励志的计划,我的眼眶不禁湿润了。但我认真地想了一下:学姐你这个计划书真的很赞,但是有一个致命的问题。


学姐说:什么问题?


我说:在我们筛选高富帅的时候,你只提了居住和工作两个因素。但这只能说明“富”,高和帅都谈不上,甚至年龄和性别都不知道啊。我们要不要再深入筛选一下?


学姐镇定地说:你太肤浅了。跟6万块一平方的豪宅这种更触及灵魂的因素比起来,像年龄、性别、容貌、性格、已婚未婚这种世俗的东西还值得一提吗?


作者:团支书 数据及算法支持:城市数据团 友情数据支持:TalkingData 来源:顾颖琼博士说天下




最全面超值的量化对冲课程


  • 量化与对冲概览

  • 期货量化交易

  • 量化投资在股票市场的应用

  • 量化投资理论进阶与高级实践


2016年1月9-10日,上海,期货大厦,仅4000元

报名咨询手机/微信:13061694649




(详情请点击“阅读原文)


 
大数据实验室 更多文章 用户画像数据建模方法 李光斗:警方是如何利用大数据抓到王全安的 降楼价,新加坡居然靠的是无人驾驶! 小数法则和经验主义 什么性格的人适合 Quant 这个职位?能否描述一下 Quant 一天的生活是怎样的?
猜您喜欢 Cookie与Session的区别-总结很好的文章 人工智能初体验 “滴水不漏”的医疗胶水,要上哪儿去找?| 科学人 展望java就业前景,让未来更加明朗! Google帝国背后,每天在经历多少失败项目?