微信号:bigdatalab

介绍:宽客俱乐部旗下美国大数据实验室,大数据研究应用.

数字解读案发现场

2016-01-10 09:10 大数据实验室

警察在处理案子时总会遇到许多难题,其中之一就是根据犯罪现场的蛛丝马迹还原出凶手作案时的完整情况。他们要从海量的干扰信息中筛选出对案件有帮助的,再通过分析这些信息推断出正确的结论。


这正是数学拯救世界的时刻。从现场测得的数据可以使用小波、概率论和统计学等方法进行储存与解读。对于警察来说,数学最重要的功能是通过对数据的各种变换处理,一举找到真正有用的信息。根据对现场数据的分析,警方往往要逆向地还原出案发时的场景,确定谁才是嫌疑犯。这个要倒过来的过程,在数学上被称为反问题。接下来我们就通过列举几个实例来展示数学是如何在侦查领域立下战功的。


算出车祸时的汽车行驶速度




交通事故可谓是世界上最频发的案件,而案发时的车速则是衡量事故责任的重要依据之一。


一般来说,警察在交通事故现场能够获得的信息不外乎车辆被损坏的程度、目击者描述以及车胎的印记。但倘若没人看到,谁来判断这是意外车祸还是蓄意谋杀?但如果车主真的踩了刹车(也就是意外车祸),轮胎痕迹是不会说谎的。通常“踩过刹车”的轮胎痕迹应该呈现一个“三段式”的特征:


通过前后轮胎痕判断轴距(示意图)


滚印-压印-拖印。由于汽车的制动力是逐渐加强的,所以在司机踩下制动的时候,胎痕首先会从滚印变成压印,而后车胎“抱死”,拖印也就在这个时候出现了。因此,只要测量压印和拖印出现的时间和特征,就可以很轻易地得知汽车是否刹车,以及是何时开始刹车的了。


如果我们只关心车速,那只要测出制动拖印长度(即刹车距离)和地面的摩擦系数,就可以请出牛顿经典力学登场解决问题了。也许这是一个高中生都会做的物理题,但它的确在事故调查中发挥了很大作用。


实际中,交警的估算要复杂很多,比如刹车过程中,摩擦系数(实际中称为附着系数)会随着汽车制动的过程而发生变化,这时就需要大量的实践总结,用一个可靠的经验公式来修正。而如果事故是发生在积水较深的路面上,积水的影响则不容忽视(水滑现象),这时候的计算则需要引入水压强以及水和胎面间迎击面长度这些变量。


还原歹徒车牌号码

“紧急!紧急!城南方向有一家珠宝店被抢劫了!”大家纷纷武装到牙齿,摩拳擦掌,准备去和歹徒搏斗。可是等等,哪辆车才是歹徒驾驶的?


好消息是摄像头拍下了汽车逃逸时的画面。


坏消息是那个画面看不清楚。




别担心,这时候数学又大显神威了。我们可以认为,看不清的图像就是清晰图像经过“模糊”过程后得到的结果。用数学的话来说就是,“模糊”可以看做是一个函数。只要我们能够知道这个函数的表达式,就可以设法逆向地还原出清晰的图像。我们同样可以用函数来表示清晰图像与模糊图像,分别记为 f 和 h ,而把模糊过程记为 g。那么一般而言,这个模糊过程的模型就是如下这样:




在上式中,x 表示任意一个像素, f( x ) 是清晰图像中每个像素的图像, h( x ) 就是模糊图像中每个像素的图像。如果我们能够知道 g( y ) 的详细情况(这可以根据汽车的实际运动情况模拟得出),那么便能够通过 h( x ) 解出 f( x )。下图是用数学方法得到的清晰图像与抓住歹徒后拍摄的真实图像,是不是感到还原度非常高呢?




从算出连环杀手的住处到确定传染病的传染源


连环杀人犯总让人都感到恐慌,尤其是当你和他同处一城的时候。如何根据已有的犯罪地点、时间等数据,推测出凶手的家在哪里?


在美剧 《NUMB3RS》 的第一集里就出现了这样的情节。然而与一般警局不同的是,他们请来了一位数学家,这位数学家就使用了犯罪地理学中如下的公式,计算出了连环杀手可能的住处。




其中 | X i - x n | + | Y i - y n | 表示的是点 ( X i , Y i ) 到第 n 个犯罪地点 ( x n , y n ) 的 曼哈顿距离 。其中还有三个常数 f , g , k ,则大概是经验数据或由计算机拟合得到的。这个公式计算出来的 p i,j 就表示犯罪住处位于 ( X i , Y i ) 的概率。



这么一大块公式看起来很神奇,它是怎么得到的?实际上,通过对犯罪心理学的研究,数学家发现犯罪分子在作案时有两个比较明显的特征:


1.考虑到成本,便捷性以及对周围环境的熟悉,他们不会在离自己住所太远的地方作案——实际上 70% 的连环杀人犯都会在离住所两英里内的区域作案.


2.为了安全起见,不留下让警察怀疑到自己的蛛丝马迹,连环杀人犯也不会贸然对自己的邻居下手。


上述的公式就是在这样的大框架内得出来的,并且在实际运用中效果也很不错。


有趣的是,这个本用来抓捕犯人的数学公式竟然还能用到对传染病的控制上!卫生部门希望在传染病刚刚流行的时候就能够找到传染病的源头,从而在造成更大影响之前将其扑灭。巧合的是,传染病的传播特征和罪犯选择作案地点的特征非常相似。无论是什么样的传染病,都需要生活在寄主体内,基本不可能在空气中长久地漂浮,所以它们不会感染离源头太远的地方。又因为传染病源不能百分百保证感染遇见的每一个寄主,所以它们需要从源头扩散到一定的距离才能找到适合生存的新环境——“不能太远也不能太近”,这和连环杀手的作案风格如出一辙。在这里,数学又一次出人意料地在看起来不相关的领域大展拳脚。


本文对一些现代的数学破案方法做了一个概括的介绍,但没有详细地解释具体细节。这是因为现实中涉案的诸多因素都很复杂,并且绝大多数情况下这些方法需要借助计算机模拟,并非一两段话就能够说明详情。


参考资料:

[1] Crime fighting maths

[2] Steven C Le Comber, D Kim Rossmo, Ali N Hassan, Douglas O Fuller , John C Beier(2010), Geographic profiling as a novel spatial tool for targeting infectious disease control, International Journal of Health Geographics.10:35


(来源:果壳网 作者:严酷的魔王)







跨国名师开讲:建立系统的量化数理分析思维能力


深入理解金融市场----(数据科学下的视角)
统计、概率分析回顾以及金融分析中的应用
金融中的统计和量化的编程实践
禅修课: 生命故事里数字的灵性之美——曼陀罗思维法
金融中的统计和计量
经济学中时序分析方法
初识衍生工具及对冲策略
算法交易实践


1月16、17日,北京


咨询报名手机/微信:13061694649


 
大数据实验室 更多文章 用户画像数据建模方法 李光斗:警方是如何利用大数据抓到王全安的 降楼价,新加坡居然靠的是无人驾驶! 小数法则和经验主义 什么性格的人适合 Quant 这个职位?能否描述一下 Quant 一天的生活是怎样的?
猜您喜欢 逆向分析网络协议 iOS 篇 如何在数据农耕时代做个好“数农”? 【Python爬虫实战】爬取百度贴吧帖子 高薪人士的八点建议 相关搜索 --- 离线和在线的结合