微信号:bigdatalab

介绍:宽客俱乐部旗下美国大数据实验室,大数据研究应用.

这些数据告诉你上海的房子到底怎么了!

2015-11-16 08:49 大数据实验室

学姐最近开始看房子了。


昨天,她过来找我,问:“小团啊,最近股市风起云涌变幻莫测,我觉得还是投资固定资产比较靠谱。可是,我一个外地女生在上海买得起房吗?”


我说:“学姐你收入多少?我帮你算算吧。”


学姐说:“这也太隐私啦,可不能随便告诉你,你就从整体上看一看吧。”


好吧。为了满足学姐这个毫无诚意的无理要求,我只好找出某房地产代理商提供的2014.7-2015.6上海一手房交易的抽样数据,样本数大约1万个,数据字段包括房屋价格和区位信息、购房者性别及脱敏后的身份证号(不包括姓名和末4位)等。


既然不掌握学姐的个人收入数据,那么我们只能从统计的角度看看:


上海的房子都被谁买走了呢?


我们就从购房者的户籍来源、性别、星座、年龄四个角度分析一下吧。


Part1:购房者来源:上海人VS新上海人


我们将身份证号以“310”开头的购房者定义为“土生土长的上海人”,简称“上海人”;将其他购房者,也就是原户籍不在上海、已在上海购房的人定义为“新上海人”。


从最近一年的数据来看,购房者中上海人占比为48.5%,低于新上海人的51.5%。也就是说,上海有一半的房子被原籍意义上的“外地人”买走了。


那么,新上海人都来自哪里呢?请看下图(颜色越深表示在沪购房者人数越多):




可以看到,各省在沪购房者人数呈现明显的以上海为中心向外递减的圈层结构,即距离上海越近的地区,来沪购房者越多。


按地域片区来看,在沪购房者人数呈现出“华东>华中>东北>华北>西北>西南>华南”的规律。而在华东地区,原籍江苏、安徽和浙江的购房者占据了新上海人总数的41.7%。


具体到城市而言,这些外地买房者的聚集度如下图所示:




很明显,来沪买房子的新上海人大多来自于上海周边的城市。但问题是:


是不是来自于这些地方的新上海人更热衷于买上海的房子呢?


为了回答这个问题,我们定义了各省购房者的上海买房指标I:


Ii=一年中在上海购房的原籍在省i的人数量(人)/上海外来人口中来源地为省i的人口数量(万人)


我们把各省的I值落在地图上,颜色越深表示买房比例越高:




可以看到,这张图与上一张图差异巨大。


买房比例最高的居然是东北、华北和新疆!而在买房人数上占优的华东,买房比例反而是偏低的。总体来看:


新上海人买房比例top3:天津、辽宁、内蒙古。

新上海人买房比例bottom3:安徽、四川、贵州。


我想,大概北方离上海挺远,因此只有实力强大、内心坚定的北方人才会来上海发展,而且来就抱着“扎根”的信念;与之相比,从华东来上海的人数量更多、目的更多元、经济实力和个人能力差异也比较大,因此拉低了本省人在上海购房的比例。


学姐,作为一个外地人,你下定决心买房了吗?


Part2:购房者性别:男性VS女性


从总体来看:


最近一年的上海购房者中性别比为147:100;

购房者中,上海人性别比为144:100;

购房者中,新上海人性别比为151:100。


显而易见,上海的房子更多都被男性买走了。


我们可以看看不同原籍的购房者的性别比(蓝色表示男性购房者比例高,红色表示女性购房者比例高,黄色表示相对均衡;删去了数据异常的西藏和重庆样本,以下同):




可以看到,来自全国大部分地区的购房者都以男性居多,在沿海地区更甚。


上海购房者性别比最高原籍省top3:广东、山东、江苏。

上海购房者性别比最低原籍省top3:新疆、海南、宁夏。


那么,男性买房比例是不是比女性更高呢?


还是用Part1中定义的购房指标,我们将购房性别比与总人口性别比进行比对,计算得到新上海人中男女购房指标分别为8.9和5.0。


没错,就上海而言,男性买房的比例也远比女性更高。


那么,这一差异有没有地域特征呢?


我们按照原籍所在省做出了男女购房比例差异度(男性的购房比例减去女性的购房比例),蓝色表示男性购房比例高于女性,红色表示女性购房比例高于男性,黄色表示相对均衡:




可以看到,全国大部分地区的男性在上海购房的比例都高于女性,且东部比西部差异更大。


新上海人买房男性指标最高top3:天津、辽宁、内蒙古。

新上海人买房女性指标最高top3:北京、宁夏、河北。


看来买房子始终还是大部分男性的核心人生任务啊。学姐,你赶紧买房子改变这个比例吧!


Part3:购房者星座


接下来,我们又非常八卦地统计了最近一年在沪购房者的星座。




可以看到,无论男女,天蝎、天秤和射手都稳居前三甲。


难道说,腹黑、优雅、热情可以大大提高购房成功概率?


等等,这三个星座从出生日期上不是连着的吗?我好像知道了什么……


学姐,你们双子貌似在买房上表现的最挫嘛,哈哈哈。


Part4:购房者年龄


我们算了一下:


上海人的购房年龄平均数为38~39岁;

新上海人的购房年龄平均数为35~36岁。


也就是说,新上海人购房比上海人要早三年(注:未区分首套房和换房)。


但如果把购房者分为上海男、上海女、新上海男、新上海女四个组,并按空间圈层比较的话,会看到差异更加清晰。




可以看到:


上海男和新上海男的年龄随空间圈层的变化趋势相同,且3岁的年龄差异稳定存在。


但值得注意的是:市中心女性购房者年龄比男性要小,而郊区女性购房者年龄比男性要大。


学姐,你到底要买哪里的房子呢?


彩蛋:上海的好房子都被谁买走了


什么是“好房子”呢?一千个人心中有一千个哈姆雷特。


为了回答这个问题,我们不妨简单粗暴的认为市中心的就是好房子。


我们仍然按照四组人购买的房子的区位进行统计,如下图所示:




如图可知:


市中心(内环以内),上海女>新上海男>新上海女>上海男;

中心城区(外环以内),新上海男>上海男>新上海女>上海女。


简单的说就是:上海中心城区的新上海人比上海人更多,更多的好房子被新上海人买走了。


这是为什么呢?


我猜可能是由于以下原因:


从外地来到上海发展,并买房成为新上海人的,本身就拥有较强的个人能力或经济实力;


上海人只能在上海买房,个人能力和经济实力参差不齐,因此在市中心和郊区都会买房(去其他地方发展的上海人数量很少,忽略不计)。


为了印证这个猜想,我又用了新上海人购房的总价与其原籍省的人均GDP进行了比较,如下图所示:




如图可知,二者间的正相关的关系还是比较明显的。也就是说,买什么样的房,跟地区和家庭的经济实力有着很大的关系。


等等,这难道就是传说中的拼爹?


再对性别进行比较的话,我们会发现:从市中心向郊区,购房者性别比呈增加趋势,也就是说女性买房比男性更靠近市中心。这一点在新上海人中更为显著。




根据我国“女儿富养,儿子穷养”的国情,这个结果似乎也是可以理解的。


何况,女儿除了可以拼爹,还可以拼干爹嘛。


学姐,你说呢?



作者:方娴、团支书

数据和算法支持:同策房产咨询、城市数据团

来源:微信公众号(城市数据团)





中国量化投资国际峰会 量化投资高级研修班


  • 国际名校专家师资团队

  • 博士教授海归领衔授课

  •  八大量化核心课程体系

  • 华尔街金融实战案例教学


6800元/人(量化投资高级研修班2天+峰会1天),含会务费、研修费、资料费,12月4、5、6日交流午宴、受邀参加12月5日交流晚宴及12月6日峰会;


报名电话/微信:13061694649



(点击“阅读原文”查看详情)


 
大数据实验室 更多文章 用户画像数据建模方法 李光斗:警方是如何利用大数据抓到王全安的 降楼价,新加坡居然靠的是无人驾驶! 小数法则和经验主义 什么性格的人适合 Quant 这个职位?能否描述一下 Quant 一天的生活是怎样的?
猜您喜欢 创造新价值、建立1对1的顾客关系、勇于变革为现实和数字世界的交汇铺平道路 元数据核心架构解析(PPT) 【Love Data 大数据峰会】活动报名马上截止啦! QQ空间直播秒开优化实践 这个必须赞!文科生也能读懂的 Deep Learning 科普帖