微信号:bigdatalab

介绍:宽客俱乐部旗下美国大数据实验室,大数据研究应用.

数学告诉你家庭关系的奥秘

2015-11-18 08:43 大数据实验室

一直跟踪家庭关系可能非常困难。假如埃德娜与你母亲的叔叔查理结婚,你应该喊她什么?如果你父亲表弟的女儿刚刚生了一个小男孩,你们两个人怎样被相互介绍?谁是你的"曾曾姑母"?怎样发现你的"移去两次的第一代表亲"?幸运的是,一点儿数学逻辑可以帮助澄清谁应被叫什么并且为何这样叫---甚至可以检测不同亲戚之间的基因相似度。



为什么曾祖母比祖母大?

祖先血统

从头开始(当然,从你的的上代讲起吧),你当然有两个双亲,一个是父亲,一个是母亲。继续朝上走,他们每人都有两个双亲,总共给了你四个祖双亲,即祖父母和外祖父母:



再向上追溯,你祖先中的每一个转过来也有两个双亲,这样每次在称呼前就要加上一个额外的"曾"字。例如,你的所有母系一方的血统是:



等等,母亲,外祖父,曾外祖父,曾曾外祖父,曾曾曾外祖父。


因为每个祖先有两个双亲(一个父亲一个母亲),向上第n代,你有2n个祖先:两个双亲,四个祖双亲,八个曾-祖双亲,十六个曾-曾-祖双亲,等。加起来,一直到上n代,你总共有2+22+23+⋯2n=2n+1−2个祖先;例如,你所有的双亲、祖双亲和曾-祖双亲的个数是23+1−2=14。简言之,你的祖先形成一个完全二向图,感觉足够简单。

后代遗产

如果你有孩子,则他们的孩子是你的孙辈,且你孙辈的孩子是你的曾-孙辈,等等:




与祖先情形不一样,你的后代个数缺乏简单的公式。你能做的只是数一下你的子女个数,他们所有子女的个数,等等。例如,即使你有五个孩子,有可能他们当中没人有子女,此时你的孙辈个数为零。另一方面,如果他们每人也生了五个孩子,则你将有二十五个孙辈,这里就没有什么公式可以遵循了。

旁系

当某人有多个孩子后,家族之树开始膨胀,产生像姐妹、外甥女、姑婆婆等更多的这样的新关系。作为开始,如果你的父母除你外还有其他子女,他们当然是你的同胞,即你的姐妹和兄弟。如果你和你的同胞都有孩子,则这些孩子彼此是堂表兄弟姐妹。然后,如果他们中的两个又有孩子,则这些孩子互相是第二代堂表兄弟姐妹;他们的孩子就是第三代堂表兄弟姐妹,等等。




一般来说,向上第n代堂表兄弟姐妹共享两个第(n+2)代的祖先(但不共享第(n+1)代祖先)。因此,堂表兄弟姐妹共享两个祖双亲(但不共享双亲)。第二代堂表兄弟姐妹共享两个曾-祖双亲(但不共享祖双亲),等等。


由此可见,如果A和B是第n代堂表兄弟姐妹,则A的孩子与B的孩子是第(n+1)代堂表兄弟姐妹。这样,堂表兄弟姐妹的孩子是第二代堂表兄弟姐妹,第二代堂表兄弟姐妹的孩子是第三代堂表兄弟姐妹,等等。事实上,如果我们把同胞视为第零代堂表兄弟姐妹,则这个理由也用于同胞:第零代堂表兄弟姐妹(即同胞)的孩子是第一代堂表兄弟姐妹。


最后,你同胞的女孩是你的侄(或外甥)女,他们的孩子则是你的侄孙女(或侄孙),等等:




显而易见对每一代的"侄儿"的情形和"侄女"是类似的。

认输

现在你知道了你的下代堂表兄弟姐妹来自何处。要知道你的堂表兄弟姐妹来自哪里,我们必须上移到你的双亲一代。你双亲的同胞是你的叔伯、姑母或姨妈。他们的子女是你的堂表兄弟姐妹(因为你和他们共享祖双亲,但不共享双亲):




如果你的堂表兄弟姐妹有孩子,对你而言他们是谁?嗯,叫法颇为奇怪:你的堂表兄弟姐妹的孩子被叫成是你的"移去一次的堂表兄弟姐妹",且他们的孩子是你的"移去两次的堂表兄弟姐妹"。




要知道你的第二代堂表兄弟姐妹来自哪里,我们必须上移两代。你的祖双亲的同胞是你的姑奶奶姑婆婆或叔(舅)祖。所以他们的孩子(及你双亲的堂表兄弟姐妹)是你的移去一次的堂表兄弟姐妹,而他们的孩子是你的第二代堂表兄弟姐妹。




同样的模式可以向上移到任一代。再一次,你的第n代堂表兄弟姐妹和你共享第(n+2)代祖先,但不共享第(n+1)代祖先。你的第n代祖先的同胞是你的曾⋯曾姑母或曾⋯曾叔伯,其中"曾"字重复n−1次。更进一步,你的第m代祖先的第n代堂表兄弟姐妹,以及你的第n代堂表兄弟姐妹的第m代后代,是你的第n代移去m次的堂表兄弟姐妹。


例如,当n=3及m=2时,你的祖双亲的第三代堂表兄弟姐妹是你的移去两次的第三代堂表兄弟姐妹,你的第三代堂表兄弟姐妹的孙辈也是你的移去两次的第三代堂表兄弟姐妹。向后追溯到n=3,给出:




在此图中,你的第三代堂表兄弟姐妹(n=3)共享你的曾-曾-祖双亲中的两位(第n+1=4代祖先)。你的曾-姑奶奶是你的曾-祖母的同胞姐妹(n=3)。你的移去一次的第二代堂表兄弟姐妹由于是你母亲的第二代堂表兄弟姐妹而得到那个称呼,而你的移去一次的第三代表妹获得此名称,因为她是你的第三代堂表兄弟姐妹的女儿。够繁琐的吧!

血浓于水

我们关心家庭之树的理由之一是因为某些家庭关系对我们来说有种"更相关"的感觉,因而应当被帮助、保护及爱戴。这种态度可能有进化的基础:我们的基因历经多年而生存下来,是我们的祖先不懈努力的结果,不仅关心自己,而且也照顾近亲。正如一句古代阿拉伯的贝督因格言:"我紧靠我的弟兄,我的弟兄和我紧靠堂兄弟姐妹或表兄弟姐妹,而我的这些亲属又紧靠陌生人。"这清楚地表达了基因上与我们最近的人的关系学。


这就引出了一个问题:亲戚的基因和我们自己的基因有多相似?首先,我们的基因物质的99.9%对所有人(甚至你家庭成员的配偶)都相同,且这确实就是为何我们是人类。更进一步,有些人可能偶然地和我们共享其他一些基因;例如,如果我遇见一个陌生人,棕色的眼睛就像我,但这却不能保证我们是近亲。此外,基因传递有许多随机性(每个人分别从父母那里获得一半的基因,但那一半的组成部分来自父母中的哪一个却是随机选择的,无法预测),因此我们不能确切地得出精确的结论。


要处理所有这些问题,我们给予每人一个相关性系数,它代表着他们的基因借助于家庭关系而必须等同的期望分数值(即平均而言的分数值)。这种处理将所有的随机性平均化,集中于更详细地由于家庭联系导致的基因相似性。


根据这个定义,陌生人具有0相关性(最小的可能值)。与此相对照,你和你自己的相关性为1。其他相关性系数落在这两个极端值之间。例如,因为你从你母亲处获取了一半的基因物质,你和她的相关性值为1/2。你和你父亲的相关性值也为1/2。同理,你和你的孩子的相关性值同样是1/2。到此为止:




下一步考虑你的外祖母。她给了你母亲一半基因,然后你母亲也给了你一半基因。有可能你获得的一半基因就是你母亲从她母亲获得的那一半基因恰好一样,也可能你的这一半基因与你母亲从你外祖母得到的那一半基因没有任何重叠。但是平均来说,也就是所期望的,你从你母亲得到的基因中有一半来自你的外祖母,因而你和你的外祖母的相关性值是一半的一半,即1/2×1/2=1/4:




继续向上追溯,你和你的曾祖母的相关性值是一半的一半的一半,即(1/2)×(1/2)×(1/2)=1/8:




(对任一层的父方上代类似)一般地,你和你的第n代祖先的相关性系数是1/2n。


同样理由,你和你的第n代子孙的相关性系数也是1/2n。因此,你和你的女儿的相关性系数是1/2,和你孙女儿的是1/4,而和你重孙女儿的则是1/8(对"儿子"等等情形亦然)。


对兄弟姐妹而言,情形稍微复杂一点。首先考虑半-同胞情况(半-姐妹或半兄弟),即他们共享父母之一。因为他们的每一个具有来自共享那个父亲或母亲的一半基因物质,他们的相关性系数是一半的一半,即1/4:




正规(完全)同胞类似地共享来自其母的1/4基因物质及来自其父的1/4基因物质,这给出1/4+1/4=1/2总的相关性系数:





一个特殊情况是具有同样基因的恒同孪生同胞,他们具有相关性系数1。但是来自父方的孪生同胞的相关性系数为1/2,和一般同胞一样。


继续向上走,因为你的母亲和姨妈为同胞,她们的相关性系数为1/2。同时,你和你的母亲的相关性系数为1/2,因此你和你的姨妈的相关性系数是1/2×1/2=1/4:



同样,你和你的侄女或侄儿的相关性系数也是1/4。


然后,因为你的堂表兄弟姐妹和你的姨妈有相关性系数1/2,后者又与你有相关性系数1/4,由此可见,你和你的堂表兄弟姐妹共享相关性系数1/8:




现在,由于你的母亲和她的堂表兄弟姐妹有相关性系数1/8,并由于你和你母亲有1/2的相关性系数,且由于你母亲的堂表兄弟姐妹与其孩子(你的第二代堂表兄弟姐妹)有1/2的相关性系数,由此得出你和你的第二代堂表兄弟姐妹的相关性系数为(1/2)×(1/8)×(1/2)=1/32:




一般地,从第n−1代堂表兄弟姐妹转到第n代堂表兄弟姐妹将引入两个新因子1/2。因为(1/2)×(1/2)=1/4,这意味着你和你的第n代的堂表兄弟姐妹的相关性系数总是等于1/4乘上你和你的第n−1代的堂表兄弟姐妹的相关性系数。由此可见,你和你的第n代的堂表兄弟姐妹的相关性系数是1/22n+1。


因此,你和你的堂表兄弟姐妹的相关性系数是1/8,与第2代的堂表兄弟姐妹的相关性系数是1/32,与第3代的堂表兄弟姐妹的相关性系数是1/128,等等。


关于移去一次的堂表兄弟姐妹等又是如何呢?这样看吧:因为你和你的堂表兄弟姐妹的相关性系数是1/8,因为你的堂表兄弟姐妹与其孩子(你的移去一次的堂表兄弟姐妹)的相关性系数是1/2,因此你和你的移去一次的堂表兄弟姐妹有相关性系数(1/8)×(1/2)=1/16:




这个模式继续下去,每一次新的"移去"引入一个额外的因子1/2到乘积中去。因此你和你的移去m次的第n代堂表兄弟姐妹有相关性系数1/22n+m+1。例如,你和你的移去两次(m=2)的第三代(n=3)堂表兄弟姐妹的相关性系数是1/26+2+1=1/29=1/512---血缘关系不再近了。


我们可以将各种亲戚关系的相关性系数列表如下:




这个表能被看成表达你必须保护及帮助亲戚的进化等级,它由早期进化生物学家J.B.S. Haldane很好地总结出。当他被问及是否放弃自己的生命以救活淹水的兄弟时,他并且回答道:"不,但是我会救两个兄弟或八个堂表兄弟姐妹。"这里他注意到2×(1/2)=8×(1/8)=1,即两个兄弟或八个堂表兄弟姐妹相当于他自己的一个拷贝。


那么,怎样对待之前的那句格言:"我紧靠我的弟兄,我的弟兄和我紧靠堂兄弟姐妹或表兄弟姐妹,而我的这些亲属又紧靠陌生人"?用相关性系数的说法,它对应于这个观察:你和你自己的相关性系数(1)大于你和兄弟的相关性系数(1/2),后者高于你和你堂表兄弟姐妹的相关性系数(1/8),而这又高于你和陌生人的相关性系数(0):


1>1/2>1/8>0.


说上句格言的先贤似乎早就通晓上面这个不等式了。


所有形式和规模的家庭

当然,与相关性系数有关的进化规则并没有告诉家庭关系的整个故事。一般来说,人们会比保护堂兄弟姐妹更好地保护自己的配偶,虽然严格来说,一个人与配偶的相关性系数是零(因为没有实际的血缘关系)。并且,养父母与领养的小孩并无真正的遗传联系,但一般来说他们也有很浓厚的亲情。



不同的生命形式导致(遗传基因)数量上的不同,许多的物种例如蜜蜂和蚂蚁,雄性的遗传基因信息量只有雌性基因的一半。


其他的家庭关系也可能会出现。例如,如果你结婚,那么你与配偶的关系成为相应的法律关系---你丈夫的父亲是你的公公,你丈夫的堂表兄弟姐妹也是你法律意义上的等同物,等等。"法律"(in-law)的英文组合词后缀也可用到与你的亲戚结婚的人---例如,你哥哥的妻子是你的嫂嫂(英文直译是法律意义上的姐姐)。(一个例外是你姨妈的丈夫可以被你称为姨父,即使他是你"真正的"在法律意义上的舅舅;以及你叔叔的妻子同样会被称为婶婶。)




同时,一个女人可能成为你的继母(或继父,如果性别关系调换一下)。她和你的关系成为相应的"继"关系---你继母的哥哥是你的继舅,且他的孩子是你的继表兄弟姐妹,等等。当然,你和他们在法律意义上的遗传相关性系数是零,因为你们的关系是通过婚姻而不是实际上的血缘。


家庭关系可能会导致意想不到的惊奇。在最近的一次大型家庭团聚中,我遇到了一个我不认识的年轻人。经过一番讨论后,我们发现,我的曾祖父是他曾祖母的兄弟---这使得我们是第三代表兄弟。此外,我的曾祖母也是他曾祖父的妹妹。也就是说,三代以前,一家的弟弟和姐姐两人分别和另一家的妹妹和哥哥结婚。这意味着,由两条不同的路径我和他都是第三代表兄弟---我们是"双第三代表兄弟"!由此得出,我们的相关性系数是一般第三代表兄弟的两倍---也就是等于2×(1/128)=1/64---仍然不是很密切,但却很有趣。我对他说,"很高兴见到你,第三代双表弟。我很荣幸能分享六十四分之一你的基因。"



作 者: Jeffrey Rosenthal

翻 译: 丁玖,密执安州立大学博士,南密西西比大学数学教授

校 对: 汤涛,香港浸会大学数学讲座教授

转自:善科文库




中国量化投资国际峰会 量化投资高级研修班(顶级专家团队授课)


  • 国际名校专家师资团队

  • 博士教授海归领衔授课

  •  八大量化核心课程体系

  • 华尔街金融实战案例教学


6800元/人(量化投资高级研修班2天+峰会1天),含会务费、研修费、资料费,12月4、5、6日交流午宴、受邀参加12月5日交流晚宴及12月6日峰会;


报名电话/微信:13061694649



(点击“阅读原文”查看详情)


 
大数据实验室 更多文章 用户画像数据建模方法 李光斗:警方是如何利用大数据抓到王全安的 降楼价,新加坡居然靠的是无人驾驶! 小数法则和经验主义 什么性格的人适合 Quant 这个职位?能否描述一下 Quant 一天的生活是怎样的?
猜您喜欢 Android应用启动优化:一种DelayLoad的实现和原理 敏捷破冰之旅(九) 密码改变了我的生活:求婚成功 从开发者的角度聊聊 Alfred 我是程序员,加班就是我活该吗?