微信号:pingcap2015

介绍:PingCAP 专注于新型分布式数据库的研发,是知名开源数据库 TiDB (Github 4100 stars) 背后的团队,研发总部在北京,是国内第一家开源的新型分布式 NewSQL 数据库公司,也是国内领先的大数据技术和解决方案提供商.

专访 | 数据库市场迎来拐点了么?创业公司 PingCAP 想用开源的方式重塑一套「底层

2018-09-17 18:50 周小丹

文 / 周小丹 极客公园


PingCAP CEO 刘奇的第一笔融资来的异常顺利。

2015 年,程序员刘奇和两位合伙人从豌豆荚辞职后成立 PingCAP 时,对 BP、公司估值等问题一窍不通。他们手里只有一份关于解决底层关系型数据库扩展的产品方案,理论启发则来源于 Google 的分布式关系型数据库 F1 和 Spanner 的论文。

预料之外。第一次与经纬投资人见面的两小时内,PingCAP 就拿到了天使轮启动基金。再回忆起来,自称当时不懂「商业」的刘奇还觉得幸运。

后来,「运气」不再是支撑公司发展的主要动力。用了两年时间,PingCAP 迭代到了 TiDB 1.0 的稳定版本并投入市场。但很快,在 2017 年完成 1500 万美元 B 轮融资后,又在 2018 年 9 月拿到了复星和晨兴资本领投的 C 轮 5000 万美元融资。

投资人想下注的是赛道:根据 IDC 预测,到 2025 年全球数据将增长到 163 ZB,这个数字是 2016 年的 10 倍。数据市场的爆发,也给交付数据存储和访问带来了前所未有的挑战,需要用新的数据库技术克服。而 PingCAP 的产品方向就是通过提供承载生产系统的分布式事务性数据库,适应这个时代对于数据库的新需求。

这是被 Oracle、IBM 等巨头沉疴业务的夹缝中生长出的新机会。基于分布式架构的事务性数据库被视为承载短时间内爆发的流量、弹性处理海量数据的最好解决方案。暂时,国内可能只有 PingCAP 一家创业公司能够提供这样的能力。

需求和供应之间出现了巨大的空白,作为先行者的 PingCAP 在这片空白里得到了飞速成长的机会。

刘奇  PingCAP 联合创始人兼 CEO


「生逢其时」的 PingCAP

作为所有 IT 行业的「基础设施」,数据库的生意,一直是在跟随着 IT 行业的业务需求而变化和升级着。

传统的存储方案里,Oracle,微软,IBM 和 SAP 等关系数据库产品的增长和主导地位。后来随着信息数据的存储需求变化,非关系型产品,比如 NoSQL 的 MongoDB 和 Couchbase,并迎来了新的供应商和创新的激增。

但大数据时代的信息数据又一次实现了爆炸性的增长。几年前,刘奇还在京东工作时,就感觉到传统的存储构架已经无法解决如此大数据量的存储落地需求了。

这个判断和 TiDB 后来走向市场时得到的验证一样。刘奇最熟悉、最先接触的是一批互联网行业的客户。在国内互联网行业还处于高速增长的阶段里,流量暴增有时甚至是「一夜之间」发生的事情。他拿转转和摩拜单车举例:「两家公司进入微信九宫格之后,流量有了十多倍的增长。因为流量涨的太快,在传统架构里,起码需要花半年时间准备,否则就一定需要一个能够有弹性能力、伸缩性的数据库产品。」

一定程度上来说,PingCAP 抓住的就是几个这样的「时间点」。

PingCAP C 轮融资领投方复星新经济产业集团董事总经理丛永罡表示:「TiDB 解决的,是分布式计算中最后一个没有被解决的问题。」在公有云的出现解决了计算分布式和存储分布式的难题后,如何实现数据库分布式一直是行业面临的难题。这涉及到被「拆分」存储的数据如何与随时发生变化的业务逻辑做匹配,并且适应弹性需求。「在做业务逻辑调整、要做数据迁移时,新业务和原有数据的匹配难度非常高,而且这种做法本身也不是那么适合来做横向的扩张。」

而 PingCAP 则在这方面实现了技术突破,用水平扩展的分布式关系型数据库产品打开了市场。这也是让丛永罡感到兴奋的地方:TiDB 的壁垒,很大程度上来自于底层技术。这也意味着作为抢先进入市场的先行者,TiDB 更有机会继续迭代和升级自己的产品服务。

但是,在分布式关系型数据库领域,刘奇也并非没有直接竞争对手。诞生在美国的 CockroachDB(蟑螂数据库)也正在分布式关系型数据库领域拓展客户。C 轮投资前,丛永罡考察对比过 CockroachDB 和 TiDB 的各项指标,但他发现,虽然起步时间更晚一年,但 TiDB 的发展速度却更快。

刘奇耿直。他将 PingCAP 的「生逢其时」归结于中国这个特殊市场带来的红利:

「在国外,某一领域的头部公司出现后,一般不会有非常强势的竞争者出现。但这种情况在中国快速发展的神话中是很常见的。惨烈的竞争就意味着企业需要更快的增长速度,这种情况下,也必须赶快把基础设施能力提升上来。」


开源的社区,和广阔的市场

PingCAP 进入的是一个庞大又增长迅猛的市场。据 IDC 统计, 整个数据库市场已经超过 400 亿美元。从收入上看,大部分市场还是由像 Oracle 和 Microsoft SQLServer 这样的闭源商用数据库所占据着。

这意味着,PingCAP 需要在巨头的笼罩下争取市场。作为国内最先推出开源的新型分布式关系型数据库的公司,教育第一批用户的任务也落在了刘奇的身上。

这并不是一项简单的工作。说服用户将原有的数据库换成一套全新的产品存在风险,刘奇明白,「谁愿意拿自己线上的业务去冒险尝试一个全新的数据库呢? 况且还是一家创业公司的产品。」

PingCAP 的做法是让 TiDB 能做到与 MySQL 数据库的兼容。说服用户先将 TiDB 作为背后数据同步,与前端数据库相连,可以运行在实际生产系统。当按照这种方式运行一段时间、用户认可 PingCAP 的产品后,会逐步替换掉 MySQL 数据库,将 TiDB 作为前端数据库。

刘奇记得,TiDB 还在内测时,公司的第一个客户是游戏公司盖娅互娱。「当时对方的 MySQL 数据库出现了问题,整个系统已经卡顿到无法使用。」由于需要实时监测广告投放效果和反馈用户需求,盖娅互娱将 TiDB 作为后端数据集群,把前端 MySQL 的数据复制过来,进行实时查询,才度过了那一段时间的难关。

一段时间的摸索后,对于初创公司 PingCAP 来说,获取用户已经不算是一件难以跨越的难题。这一方面是因为,PingCAP 创始团队大多数来自豌豆荚、京东,BAT 等互联网公司,经历过数据指数级增长的时期,也更容易理解用户对于数据库产品强扩展性的需求。

另一方面,早在产品还在研发阶段的那两年里,PingCAP 就在通过自己的开源社区与用户保持着良好的沟通。至今 TiDB 项目在 GitHub 上共计已获得 15000+ Star,项目集合了 200 多位来自全球的代码贡献者。

刘奇是开源理念的忠实拥趸,他坚定的认为,TiDB 不能「关起门来做自己的事」。在 TiDB 的开源社区里,聚集了大量来自摩拜、知乎等互联网公司的代码贡献者。「开源能让用户们尽早的了解 TiDB 的进展是怎样的,理念是什么,我们现在能够跑的一部分代码是怎么用的,下一步迭代的方向又是什么,如果用户有兴趣,完全可以自己写代码进来。」刘奇说,「想要快速得到响应的需求,在非开源的实践里面是得不到满足的,很多需求也是用户在自己的场景下才能真正了解是什么,而开源的力量,就是能让 TiDB 跟着用户真正的场景需求去迭代。」

对于刚刚走向市场的 PingCAP 来说,开源社区不只早期为公司建立起和用户的沟通渠道,也能为这个技术团队无形中增强原本并不具备的「销售推广能力」。

刘奇承认,在这个 to B 的生意里,和巨头相比,起步时 「没有任何资源」的高管团队欠缺「销售优势」。但反过来看 PingCAP 将近三年的发展,几乎没有一个客户是通过销售关系带来的,可早期的「克制」反而带来了更好的效果:TiDB 的产品自身价值成为了最重要的考核标准。

2017 年,应用在实际生产环境的用户达到 200 家,最终产生十几家付费客户。PingCAP 也必须在未来加强自己的销售体系,但刘奇有自己的标准,希望能找到理解用户需求的「专家型销售」。对于 PingCAP 这样的创业公司来说,需要把用户需求放在第一位,而不是维护关系。

C 轮融资后,技术研发和全球化生态系统建设是 PingCAP 的重点,刘奇也在谨慎的探索更多来自于金融、医疗、物流等传统行业的客户。这将是刘奇和团队并不熟悉的领域,也意味着作为一家商业化公司的 PingCAP 需要花更多的力气去理解客户需求,维护客户体系。

在开源的新型分布式关系型数据库领域,PingCAP 暂时还没有一个强有力的竞争对手。

但这并不意味着刘奇没有危机感。PingCAP 此时的优势是跑出了一个绝对的「时间差」。开源很大的意义是在为这个新的领域建立标准,数据库产品的精心打磨需要较长周期,即便是巨头入场,从头追赶,达到 TiDB 的成熟度依然需要时间。刘奇相信,最终用户会对产品性能做出判断,用脚投票,所以对 PingCAP 来说,它必须继续维护、迭代产品,在这个「时间差」里跑的更快。

丛永罡则觉得,这是个足够广阔和有想象力的市场,在数据库行业的第三次变革来临时,一定会有更多产品和公司出现,共同推进这个过程。但「To B 的市场并不是一个赢家通吃的市场。客户永远会根据自己的需要,去找最适合自己的产品。」


 
PingCAP 更多文章 专访 | 融资 5000 万美元,PingCAP 刘奇说希望用代码改变世界 专访 | 刘奇:几个不愿妥协的工程师探索心目中“完美”的数据库 PingCAP 完成 C 轮 5000 万美元融资 又搞了点事情 广州 · Meetup 预告 | Introduction&nbs
猜您喜欢 晶体管及晶体管计算机 程序员如何预防和查找bug?【程序员bug指南】 VMAX全闪存中的本地复制TimeFinder 京东将整合资源 推出多项云计算等新业务 程序员该懂一点儿 KPI