国产数据库后浪崛起,OceanBase如何打入千行百业?

智东西(公众号:zhidxcom)

作者 | 心缘

编辑 | 漠影

企业走向数字化,离不开一个关键的基础软件——数据库

顾名思义,数据库犹如一个存储、组织、管理所有数据的档案馆,是企业、医院、人社、银行等各种信息系统不可或缺的地基。这样一个执掌数据命脉的软件,却长期被西方大厂所垄断。

数据库商业化的起点可以追溯至1977年,33岁的美国商业奇才拉里·埃里森敏锐嗅到关系型数据库的商机,创立“软件开发实验室”,它就是日后的全球最大企业级软件公司甲骨文。第二年,中国人民大学萨师煊教授第一次将“数据库”写在黑板上,这拉开了数据库概念在中国普及的序幕。

40余年后,中国众多网民参与的双11购物节,创造了全球最大流量洪峰。在科技创新战略及大数据发展的激励下,承担起越来越多关键业务场景的国产数据库,正迎来最好时代。

热潮之中,国产数据库行业渐成百家争鸣之势,其中双11背后的关键功臣OceanBase,也在继独立运作、开源核心代码后,迈向新的阶段。

“过去一年,OceanBase的客户数实现翻倍达到400多家,其中来自非金融类客户的营收占比超过三成。”在1月6日举行的DC2021分布式数据库开发者大会上,OceanBase CEO杨冰首次对外披露其关键营收信息。

这个势头正猛的国产数据库主力,正从金融走向人社、能源、通信等各行各业。

经过11年的磨砺,OceanBase不再仅仅作为蚂蚁核心业务的幕后英雄,而成长为观察国产数据库摸索前路和尝试突围的一个绝佳样本。

一、从企业内部账本,到互联网灵魂支柱

数据库主要做三件事,记账、审账、算账。

早期数据库主要被用于封闭环境,比如医院存档病例信息、企业记录员工档案。而随着互联网、移动互联网的浪潮接棒登场,淘宝等用户可以无限扩张的环境对数据库的扩展性提出更高要求。

当单机数据库难以满足数据暴增所带来的高并发量需求,灵活可扩展、更高性价比、可实现多地多中心部署的分布式数据库成为新趋势。

如果将单机数据库比作燃油车,分布式数据库就好比新能源电动车。燃油车处理能力有限,但非常成熟;电动车虽未成熟,但有巨大的扩展能力和发展空间,在一些体验上甚至超过燃油车。

2021年是分布式数据库大发展的元年。根据Gartner的数据,2021年全球分布式数据库市场规模达到38.4亿美元,2025年将达到72.8亿美元。Gartner最新发布的白皮书认为,以OceanBase为代表的原生分布式数据库正引领数据管理技术发展趋势。

如图所示,分布式数据库经历了三代演变:前两代分布式存储系统(NoSQL)、分布式数据库(可扩展的SQL)都在一定程度上牺牲了单机性能、成本和企业级功能。

相比之下,第三代原生分布式数据库通过一体化架构,既支持完整的企业级SQL功能,享受到分布式技术无限扩展、永远在线的技术红利,又能兼容集中式数据库功能,实现与集中式相当的单机性能,逐渐成为企业核心系统升级的首选。

从2010年开始立项的OceanBase,一直是原生分布式数据库的信仰者、开拓者。OceanBase曾连续8年支撑双11,并承担会员、交易、支付、账务等蚂蚁集团的核心业务板块,数据量达到数百PB,服务器核数过百万。这打磨了它在金融级场景的坚实工程基础。

目前全国TOP200的头部金融机构中,有1/4都将OceanBase作为核心系统升级的首选。

以工商银行为例,自投入使用OceanBase以来,工商银行法人理财支撑着企业客户万亿级别的资产实现两地三中心的城市级容灾方案,达到5级容灾要求,做到7×24小时实时服务。核心业务系统数据库分布式改造后,数据库服务器资源利用率达到75%,在系统处理能力遭遇瓶颈的时候,可进行便捷的水平扩展,增加集群计算资源来提升处理能力。

在IT168和ITPUB的《国产分布式数据库选型及满意度调查》中,OceanBase的用户满意度在国产分布式数据库中排名第一。另据Forrester最新研报,OceanBase是中等营收规模赛道中唯一一家来自中国的数据库厂商,也是全球唯三具备实现Forrester定义的分布式数据库细分功能、全覆盖能力的厂商。

▲IT168&ITPUB调查显示,16.67%的受访者表示其所在企业已使用或计划采用OceanBase

二、撑起双11的同款技术,被应用到各行各业

扛住金融级场景的严苛考验后,OceanBase亦凭借稳定出色的性能,高可靠性和高性价比,逐步深入应用至通信、政务、能源等关系国计民生的重要领域。

根据OceanBase最新披露营收状况,2021年,其客户数量同比实现翻倍,达到400多家,其中来自其非金融类客户的营收占比已达到OceanBase总营收的35%,且在快速增长中。

以山东移动为例,对于这个用户规模排名第二的省级运营商来说,计费系统是其一大核心业务系统,日处理各类详单数据130亿条,数据处理性能和准确性至关重要。2020年,山东移动数据库几乎没改业务代码,就全部迁移至OceanBase。

这使其详单处理效率提升30%,存储投入成本降低90%,硬件和维保成本大幅降低,并实现RPO=0的机房级别容灾能力。同时源系统数据类型、对象、存储过程仅少量修改达成应用适配,1小时完成应用切割,实现应用系统平滑迁移。

此外,OceanBase已经在支撑多个省市人社系统的“社保系统省级大集中”。

比如2021年12月,江西人社系统在全国人社领域内首个开展国产化试点,使用OceanBase数据库运行其机关养老、企业养老、工伤保险、失业保险、职业年金及财务等核心社保数据。

系统迁移至OceanBase后,可实现征缴计划生成从16小时降至最快9分钟。基于OceanBase多数据副本分布式架构,可确保数据万无一失,7×24无间断对外提供社保信息实时查询功能。

面向能源企业的数字化转型需求,OceanBase将23套分散加油卡系统数据库全部集中到OceanBase的1套新加油卡系统中,为中石化节省了大量成本。同时,新系统可支撑近3万家加油站,实现一张加油卡全国通用,支持交易流水由“天”级降低到“秒”级,实现一体化班日结和报表需求,有力推进中石化生活综合服务商战略转型。

与国家电网的合作中,传统数据库升级到OceanBase数据库后,在电费发行场景、电费提取场景、自动化抄表场景等核心业务实现性能的大幅度提升。

在实现降本增效之余,以OceanBase为代表的原生分布式数据库正通过合作提高业务效率,改善大众日常生活的体验。

三、背后技术逻辑起底,想让用户用脚投票

达成上述的成绩,离不开OceanBase长达11年的技术积累。

“我们想做的事情就是让用户拿脚投票。”阳振坤教授是OceanBase创始人,早在2010年立项时便计划做一种可扩展的、能一体化处理交易与分析的系统,“我们的成本可能只有别人的不到一半,关键是我们一些使用的便利性。”

在阳振坤眼里,一个好的分布式数据库,是“一个”可水平扩展且一份数据存储既进行交易处理又进行分析处理的数据库。它具备“一个数据库”、可水平扩展和HTAP的三个重要特性。

此前数据库系统通常分别沿着事务处理、数据分析两条路走,而OceanBase想要走一条将两者兼顾的路,为此,它经历了双11、支付宝等大量业务场景的磨炼,以不断验证其足够稳定成熟。

对于许多客户,数据库关乎生死,因此必须确保从迁移到运维都万无一失。在对客户友好的一体化架构基础上,OceanBase创新地推出“三地五中心”城市级容灾新标准,具备高可用、高扩展、高兼容、部署灵活、高性价比等特点,并通过Paxos协议保证数据一致性,数据不丢失。

1月6日,在DC2021分布式数据库开发者大会上,杨冰公布OceanBase的全新使命:“用技术让海量数据的管理和使用更简单。”

在杨传辉看来:“只有自主研发,才能完全掌控内核。只有完全掌控内核,才能够持续在原生分布式数据库领域开拓创新。”

100%自研,使得OceanBase具备随时升级调优能力,能敏捷响应用户需求,实现快速迭代。

以前传统数据库受限于业务模式和技术,对客户需求响应较慢,易出现出现尾大不掉的情况。而OceanBase能做到完全以客户为中心,用最快的速度响应客户需求。过去一年,OceanBase共迭代了8个版本,代码提交5300多次。

这也成为了OceanBase非常重要的业务模式——产品驱动增长

“产品力始终是OceanBase的立足根本。”杨冰相信,“只有好的技术,才能创造好的产品,才能真正帮助客户。而在大量客户的个性化需求之下,产品也要反过来不断迭代优化,最终形成良性循环,促进业务发展。”

为了方便客户使用,OceanBean持续降低企业部署数据库的门槛,一方面提供覆盖安装、部署、评估、迁移、研发、运维等全过程的一整套工具体系,另一方面用普通PC服务器即可部署,不依赖特定硬件和服务,无需SAN存储。

随着产品不断迭代,OceanBase的客户结构也在持续优化,大量中小客户开始青睐原生分布式数据库,占比达到66%

2021年是OceanBase独立公司化运作的第二年,这一年,它的核心产品技术继续精进,主要取得了五个方面的突破:

1)从OLTPHTAPTPC-H整体性能提升620%,30TB刷新世界记录,自此OceanBase成为唯一在事务处理(TPC-C测试)和数据分析(TPC-H测试)都刷新世界记录的国产原生分布式数据库;

2)单核性价比大幅提升:sysbench整体性能提升68%,支持小规格部署,性价比在全球分布式数据库领域遥遥领先;

3)更强跑批能力:支持超大事务,一套引擎能同时处理交易和跑批,确保跑批负载不会影响正在进行的交易业务,并行DML和大数据导入性能分别提升270%和58%;

4Oracle平滑迁移:OceanBase是业内首个支持平滑迁移Oracle的原生分布式数据库,具备Oracle和MySQL两种兼容能力并提供迁移工具,得到多行业核心业务场景的应用证明;

5)易用性提升:支持不依赖单点的分布式主动死锁检测,能通过全链路监控来大幅降低问题排查成本。

重要的基础软件创新往往在开源社区。2021年6月,OceanBase向开源迈出一小步——面向社区完全开放300万行核心代码,并发布社区版。杨传辉说,开源版不落于2020年双11使用的版本。

据他分享,借助其一键部署工具,即便是没有写过代码的小白,部署OceanBase总共可能也只需半个小时。

目前该社区已经吸引全球超过2.3万名社区用户,有逾100位外部开发者,每3个月,OceanBase就会发布一个新的开源版本。最新社区版将电商秒杀场景性能大幅提升300%,并兼容自主操作系统统信UOS。

除了技术热情外,杨传辉也考虑实施一种将开源代码与云服务结合的商业模式,使开源这件事能够持续推进。

杨传辉向智东西透露,在2022年,OceanBase会做一个更加轻量的一体化架构,使用户部署成本更低,使用更小的CPU、内存,同时支持更高指标的数据量,并获得更优性能。

OceanBase还将进一步提升偏分析的性能,集合开源提升易用性,面向多云做更多优化,以及支持多模数据类型。

结语:国产数据库后浪崛起

无限扩展,永远在线,让客户无需担心容量和故障问题,OceanBase已朝这个目标奋斗了多年。杨传辉相信,这将是对传统数据库的一个颠覆。

尽管美国数据库大厂已筑就深厚的技术和生态壁垒,但大数据、云计算等新兴技术正助推国内企业在分布式数据库等新型数据库赛道的发展。

自研技术和培育生态注定要翻山越岭,路还长,国内数据库企业们已经积极行动起来。

相关文章