微信号:bigdatalab

介绍:宽客俱乐部旗下美国大数据实验室,大数据研究应用.

机器学习应用于古文献,解密圣经起源

2016-04-29 07:50 大数据实验室
本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载


选自 Gizmodo


作者:Maddie Stone

机器之心编译

参与:周亮




在以色列南犹太地区的阿拉德古堡中发现的着墨碑文


两千六百年前,在耶路撒冷被尼布甲尼撒洗劫前夕的最后几天里,一队犹太士兵正守望着他们王国的南部边境 。他们留下了大量的石碑——而如今,一种开创性的数码分析技术揭示了有多少个书写者撰写了这些石碑。这一研究和创新科技将会告诉我们圣经的起源。


「我们都理解,圣经不是在一时一地完成的,而可能是后来逐渐书写和编辑成的。」Arie Shaus, 一位来自以色列特拉维夫大学的数学家告诉 Gizmodo,「问题是,圣经到底是何时成书的?」


Shaus 是试图以激进的方式解决这一问题的几名数学家之一:他们要通过使用机器学习工具来确定在那个古老年代有多少人能读书认字。他们的第一篇主要分析成果刊登在《美国国家科学院院刊》上,这篇研究表明在古犹太王国读写能力相当普遍,这就为圣经的编撰创造了基础。


尽管部分结论仍然富有争议,这一研究背后的技术却可能颠覆我们对圣经时代的识字和教育状况的理解。


多数学者都同意,最早的圣经文本——包括《约书亚记》、《士师记》和两部《列王纪》——都是在第一圣殿时期的晚期,在耶路撒冷陷落于巴比伦王之前成型的。然而,这些文本是在什么条件下被书写的,它们何时被书写,有多少作者?这些都并不清楚。令人惊讶的是,那些与圣经无关的文本却可能揭示出这些问题的答案。



阿拉德古堡的航拍,这里发现了本研究中的石碑


例如,在这一时期人们把许多信息都书写在陶片上。「这些文字本身十分乏味」,Shau 说。他列举了一些军事命令和供应订单,这些是陶片文字中较常见的内容。


然而,除了犹太士兵需要多少葡萄酒之外,我们还可以从陶片中找到另一层信息:有多少人能够书写。这恰恰是 Shaus 与他的同事们的工作。他们分析了来自犹太地区南部边界附近的遥远军事古堡中的 16 片保存完好的陶片。大部分陶片都来自公元前 600 年左右,这正好是犹太王国被攻陷的前夕。


分析的第一步要求研究者们用新型图像处理工具来重建那些已经被擦去的字母。之后,他们研发了机器学习算法来比较和对照古希伯来字母的形状,以确定那些统计上可以区分的手写文字。原则上,这类似于科技公司用来侦测数字签名的算法。


「手写字体分析是一个巨大的领域,近年已出现了大量的研究,」 Shaus 说。「尽管如此,我们仍然需要研发出我们自己的工具 ,这是很有挑战性的。陶片介质的状况很糟,书写也很模糊。」


最终,该团队发明出一种手写识别工具,它能美妙地处理现代希伯来文,于是他们决定用它来检测古代石碑。满打满算,他们的分析揭示出,这十六块石碑至少拥有 6 名不同的作者。通过检验文本的内容,研究者认为这些文本作者遍布在整个从上到下的军令链条上。「从司令官到最低级的水务员都可以用写字来交流,」Shau 说。「这是一个非常令人惊讶的结果。」


研究者们认为,这一成果指示了公元前 600 年的犹太社会中「识字能力的激增」,而这意味着当时几乎一定有相当多的人接受了读写教育,从而能为支持圣经写作提供教育基础。


「这是一个高度创新和重要的研究。」Christopher Rollston,乔治华盛顿大学的一位考古学和圣经研究的专家告诉 Gizmodo,他注意到,有足够多的考古证据表明,圣经的某些部分书写于早至公元前 800 年的年代。然而,在那样的时代,什么样的人才真正具有书写能力呢?


「我认为读写能力局限于精英们,他们主要是抄写员,高级军官与神职人员。」Rollston 说,不过他也指出,在第一圣殿时期的晚期,有可能读写能力已经传播到了上层阶级之外。


或许 Shau 的工作最重要的方面是把复杂的图像识别技术引入了古代文本的研究中。 Tel Aviv 团队热切希望与其他考古学家分享他们这个用于重建字母和辨认手写的工具。通过更广泛地运用这些方法,我们或许能渐渐知晓,圣经这部历史上最经久不衰的书籍是什么时候在哪里由什么人书写的。



文中提到的论文查询:

http://www.pnas.org/embargo?embargoed-uri=http%3A%2F%2Fwww.pnas.org%2Fcontent%2Fearly%2F2016%2F04%2F05%2F1522200113




最全面超值的量化对冲课程


  • 量化与对冲概览

  • 期货量化交易

  • 量化投资在股票市场的应用

  • 量化投资理论进阶与高级实践


2016年5月27--28日  深圳两天4000元


咨询电话/微信:13061694649


 
大数据实验室 更多文章 用户画像数据建模方法 李光斗:警方是如何利用大数据抓到王全安的 降楼价,新加坡居然靠的是无人驾驶! 小数法则和经验主义 什么性格的人适合 Quant 这个职位?能否描述一下 Quant 一天的生活是怎样的?
猜您喜欢 下一个就是你!博赛HCIE认证捷报连连! ELK ——你的日志分析三剑客(1) 如何通过自动化测试 应对App的频繁迭代 如果刘易阳是个程序猿? 我的程序员经历和与头条网微信结缘