微信号:datakong

介绍:以分析的视角为切入点,蕴含以互联网、移动互联、IT等科技领域为主的一体化综合型信息服务平台.商务合作:qq:2677585642

560万Facebook人际关系数据,揭秘家庭职业传承“真相”

2017-10-15 09:04 数据挖掘与数据分析

来自:DT数据侠     ID:DTdatahero


子女选什么职业,多大程度上受到父母的影响?


父母和子女间的关系不只限于基因。父母是孩子的榜样,会为他们提供机会,还会为他们的职业道路提供建议。那么,孩子最终会和父母从事同样的工作吗?其他的兄弟姐妹也会选择一样的职业吗?不同的职业,父母对孩子的影响会有什么不同?


为了弄清这些问题,Facebook凭借自己的社交大数据对这一现象进行了研究。


Facebook分析了移除了身份信息后的两组相关的数据:一组是兄弟姐妹的职业选择,另一组是父母子女的职业选择。样本包括了英语语言区在Facebook上关联了各种家人、亲戚关系的这些人,当然这些人也都填写了自己的职业,但需要注意,这些信息都没有经过验证。


Facebook把各类职业划分为几个主要类别,其中军事职业类别存在重复的情况,因为这个类别同时包括了雇主身份、职业分类以及过往的服役记录,而其他工作分类只是基于选择的职业分类。


由于数据不包括那些无法在Facebook上勾选的职业,因此它可能并不代表整体人口,但瑕不掩瑜,研究本身还是很有趣的。


下面这两张图展示的是父亲和儿子、母亲和女儿的职业关联度情况:




根据图片来看,子女和父母选择同一个特定职业的可能性,确实因职业而异。


Facebook一共收集了560万份数据,这些数据都来自英语语言区,且父母和子女都填写了职业信息。Facebook先计算了在给定父母职业的情况下子女从事某一职业的概率,比如,一个律师父亲有一个医生儿子的概率是5%。然后,Facebook还计算出这一概率相对于其他行业的情况是个什么程度。结果发现,在这个案例里,法律从业者的儿子比其他行业从业者的儿子,从事医药行业的概率高4.6倍。


对学历要求较高的职业,父母子女间的代际关联度较高


在下面这张可视化网络图中,每个节点表示“职业-性别”的配对,蓝色表示男性,紫色表示女性,例如,标有science字样的紫色节点意思是“女性科学家”。


另外,职业标签都是缩写的。2个节点间的连线和箭头方向,表示父母是某一职业的小孩会在多大程度上选择另外一个职业(DT君注:衡量的标准是和人群的平均水平的比较)。所有线条只有当比平均概率至少大2.5倍以上才会显示,线条越粗,意味着子女选择另个职业的概率更高。



通过这样的可视化网络,我们可以了解父母与子女职业之间的联系。比如说,从蓝色的military(军事、军队相关工作)和蓝色的protective service(安保类工作)间这条线可以看出,父亲在军队中工作的话,儿子比平均水平更可能从事安保类的服务(DT君注:至少比平均水平高2.5倍以上)


通过展示这样一个关系网,并且使用力引导布局算法(force-directed network layout algorithm)去把那些代际关系比一般水平高很多的关系放在更靠近的地方的话,我们就可以看到,在上图的左侧,那些需要更高学历知识的职业会聚集得更紧密;另一方面,相对低学历需求的职业在右侧。


尽管相对来说,一个孩子很有可能跟随父母的脚步,但绝对百分比可能还是很低的。比如如果你的父亲在军队工作,则你入伍的概率是普通情况的5倍,这听上去非常夸张,但其实如果看绝对值,父亲是军人的儿子中,每4个儿子只有1个会选择入伍,也就是25%而已。至于父亲从事农业,渔业,林业的,只有3%的子女继承了这个行业,但还是比总体水平高出了7.6倍。


母亲是白领或者行政人员的女儿里,有20%会从事同样的职业,但这只比一般概率大了两倍。另一方面,如果母亲是医护人员,那女儿有8.5%的几率同样成为医护人员,并且这是总体的3.75倍。


我们也能看到跨性别的职业“继承”,例如:科学家父亲有一个科学家女儿的概率是总体的3.9倍,而律师母亲的儿子也干这一行的概率是总体的6.6倍。


另外需要注意的是,由于家庭背景,孩子进入某些职业的可能性会非常小。比如说,对于父亲从事法律的人来说,他们进入到建筑行业、维修、维护行业的可能性只是平均水平的85%。


除了父母,兄弟姐妹也会影响你的职业选择


接下来我们来看看兄弟姐妹们会选择一样的职位吗?


兄弟姐妹们不仅有一样的父母,对于双胞胎来说,他们还拥有相同的基因。对于同卵双胞胎来说,他们有完全一样的基因,对于异卵双胞胎来说,从基因上来说,他们和兄弟姐妹们没有区别。但不管是同卵还是异卵,双胞胎都是从相似的环境中成长起来的,尽管随着家里孩子数量的增加,父母的教养方式可能会产生变化,比如一个家庭中,对老大的教育可能比较严格,对最小的可能比较宠爱。但我们一般认为双胞胎受到的教养方式还是接近的。


为了分析兄弟姐妹的职业,Facebook收集了237万份数据。数据对象都是美国的同性别兄弟姐妹,并且他们在个人资料中填写了职业信息。


Facebook把兄弟姐妹分成三组,一组是同性别双胞胎,另一组是年龄相差不超过两岁的同性别的兄弟姐妹,第三组是大样本中任意两个年龄相差不超过两岁的同性别人士。他们将会比较这三组样本中从事相同工作的概率。不难看出第三组是参照组。


在第二组中,也就是年龄相差不超过两岁的兄弟姐妹间,有15%的几率选择同样的工作,这比第三组任意两个同性别同年龄的人选择相同工作的概率8.6%要高。但更惊人的数据是,双胞胎选择同样职业的概率是24.7%。


下面这些柱状图将这个结论按照职业和性别进行了更具体的细分。





如图,每条柱子有三种不同深浅的颜色。颜色最深最不透明的代表了基准线的概率。稍浅一点的代表了同性别的非双胞胎拥有相同工作的概率。最浅的代表了双胞胎拥有相同工作的概率。


第一张图是按照双胞胎从事同一类职业比例的大小来排序,第二张是按照兄弟姐妹间的大小来排,第三张是基准组。


总结来说,我们可以发现,来自一个家庭的成员倾向于选择相同的职业,特别是对于双胞胎来说。然而,绝大多数的孩子都还是选择了走自己的道路,选择与父母或兄弟姐妹不同的职业。


注:本文编译自Facebook研究博客(research.fb.com)文章《Do jobs run in families?》,内容仅代表作者观点,文中图表均来自原文,


作者 | Lada Adamic & Ismail Onur Filiz

编译 数问团队


第一期学习已满!!!

现在二三期正在招募,课程体系任你选,全部免费,终身学习,点击了解  

那些人都在爱数圈(第一期)

那些人都在爱数圈(第二期)


加入数据君高效数据分析社区,2种加人方式:


1:扫码加入


2、加入方式:


加我微信:seedata      

转账298,先拉微信群,再邀请进小密圈

犹豫的、不懂的、咨询的不要加,加了也是僵尸,时间宝贵,你我都珍惜

 
数据挖掘与数据分析 更多文章 万套短租房数据告诉你,做个短租房东可好? 在医疗影像AI应用上,英特尔要让数万开发者和亿万大众受益 数据分析报告怎么用? 英特尔Loihi自我学习芯片研发进行时:我们正在尝试复制大脑! 微信大数据看中国人的国庆长假
猜您喜欢 数字化企业云平台的Cloud Native12原则(上) 热血编程狂欢季:Unity手动实验室(上海站)精彩花絮分享 小钢再聊全栈 唯一不变的是变化: 谈谈微信应用号 当亲戚问你工资,程序猿如何作答,简直不能再机智