微信号:infoqchina

介绍:有内容的技术社区媒体

【ArchSummit】陆丹峰:数学常被用来解释数据之间的关系

2014-06-25 19:30 包研

大数据竞争,已经从海量数据获取与存储、入门级的分布式统计演变为实时流式数据处理以及深度数据挖掘。数据收集、存储、分析与可视化完成了大数据价值链的闭环。毫无疑问数据分析与可视化是大数据价值链上的重要一环。


在ArchSummit全球架构师峰会前夕,InfoQ采访了BestMinr的CEO与联合创始人陆丹峰。他评价自己学数学7年,仍只得皮毛;长期致力于架构、算法、大数据、复杂问题的数学解决方案研究。陆丹峰同时是“大数据,光大是不行的”专题出品人。以下为采访全文:


InfoQ:陆丹峰你好,向InfoQ的读者和ArchSummit的听众介绍下自己吧。


陆丹峰:大家好,我是陆丹峰。我现在在经营自己的创业公司百思科技(BestMinr.com),我有一帮神奇的小伙伴,现在工作和生活都非常满意。


InfoQ:你在本科和研究生都在北大数学专业,数学是你的特长吗?你是什么时候发现自己在数学方面的优势?这种感觉是不是对数学的研究让你对生活、工作和对事物的判断有什么影响?


陆丹峰:如果说数学也是一种特长的话,勉强算是吧。(有数学特长生一说么?=.=)什么时候发现的很难说,只是我从小我爷爷就没事给我出各种算术题,比如有一次他问我八千八百加八千八百是多少,我想了想回答16千16百。当时忘记是几岁了,总之没有学过进位,于是自己想办法把这数分解了再加。


所学到的这些入门级数据知识,让我在思考和看问题的时候能更好的建模吧。


InfoQ:从AdMaster到BestMinr,你更喜欢哪一个自己?


陆丹峰:我喜欢永远在路上的自己。好像回答的有点高大上哈哈。其实是这样的,我很喜欢现在的状态,我们的投资人很好,我们的团队也很给力,我们按照自己喜欢的方式和节奏做大家都认可的事情,没有比这个更好的事情了。


InfoQ:数据可以帮助我们更准确的描述和了解这个世界,而数学可以让数据更精准,是这样吗?这也是你现在的工作吧?


陆丹峰:前半句对的,后半句这样说比较合适:数学常被用来解释数据之间的关系,或者用来生成新的数据。目前我们的大部分工作是围绕这个主题来展开的。


InfoQ:在BestMinr,你们遇到了哪些技术难点?是怎么解决的?是底层基础设施的难度大,还是数据挖掘、分析算法难度大?


陆丹峰:我们现在遇到的技术难点还是在语义分析层面的,这个算是业界的难点了。我们目前采用一些取巧或者局部可行的方案,同时时刻关注了业界的进展。


目前对我们来说,数据挖掘和分析算法的难度要大于基础设施这块的难度。


InfoQ:你们怎么处理数据安全与用户隐私?


陆丹峰:数据隐私是玩数据的人永远要面对的事情。我们会尽量想办法保护用户隐私,实际上我们采集和处理的数据都是公开数据,大家都可以看到。另外我们提供的产品和服务会尽量考虑从统计层面出发,尽量避免提及个体信息。


关于此次ArchSummit全球架构师峰会其他专题的详细信息,请点击【阅读原文】移步至大会官网。


6月30日前报名参加可享受9折优惠。团体购票(5人及以上)将享有更多优惠。详请可邮件咨询arch@cn.infoq.com,或直接致电010-89880682。报名请至大会官网。


 
InfoQ 更多文章 Facebook如何实现PB级别数据库自动化备份 学术派Google软件工程师Matt Welsh谈移动开发趋势 Spotify为什么要使用一些“无聊”的技术? 妹纸们放假了,汉纸们做啥? 大多数重构可以避免
猜您喜欢 回归诊断与优化——OLS回归模型拟合(五) 如何更好的提出技术问题 那些年,曾经被我们误读的大数据 【产品汪的自我修养】没有产品也能拥有第一批用户 Java 9为何让开发者如此兴奋?