本文来自微信公众号:数智前线(ID:szqx1991),作者:赵艳秋,题图来自:视觉中国


大疆无人机被美国软件供应商断供、俄乌战争科技企业暂停对俄服务.....最近接连发生的事件,在国内软件行业引发连锁反应。


“我们的咨询用户数增长了50%。”一家互联网大厂数据库业务人士告诉数智前线。另一家国产软件企业人士称:“原来销售去盯了一段时间的客户,现在来主动落单了。”


但这些消息也伴随着不少公众的疑问——国产软件的技术能行吗?能否在一些关键行业替代海外软件巨头吗?


智前线咨询了多位业内人士后获悉,数据库是三大基础软件中国产替代发展最快的领域。从行业第三方调研公司到部分业内人士都乐观估计,3年内有望拿下国内半壁江山。


最后的堡垒


银行是甲骨文这些国际数据库巨头最坚固的堡垒。但2020年以来,国内银行的招投标信息,越来越多地在释放一个信号——国产数据库对甲骨文的替换正在发生。


一位前甲骨文资深人士告诉数智前线:一些城商行的核心系统,数据库的国产替代已经发生;四大行,包括邮储银行,在其新一代二类系统的国产替换也已发生。但原来那些最难的IBM大型机和部分大型甲骨文数据库的替换,还没有规模发生。


“大型银行中,目前最大的可能要算中信银行核心系统的数据库替换。”上述人士说。这个替换工程正是中兴通讯数据库铺人去做的甲骨文替换项目。


图:在银行核心系统的数据库替换中,目前最大的是中信银行<br>
图:在银行核心系统的数据库替换中,目前最大的是中信银行


在人们的印象中,甲骨文数据库在银行历来是很难被替代的。


“金融系统稳定为王,国产替换带来的风险难以承担”、“替代不了”、“用纯自研的国产数据库就是情怀”的声音在公众中很强。


但多位数据库行业人士告诉数智前线,从技术角度看,金融行业的国产替换已不是问题。“哪一个银行的瞬时交易能超过阿里双11?而双11背后的数据库早就是国产自研了。”


现在替换的主要问题是迁移工程量和人力投入太大。”上述人士说。他估算,哪怕是一个城商行核心系统的替换,也得接近两年时间。“因为不单是数据库,还涉及应用开发商对应用的修改、验证,涉及上上下下百十号人。核心团队也得有四五十人,基本上不干别的就得干两年,所以这个工程耗人、耗钱。”


而迁移后的稳定性又是另一个考验,潜在的问题主要在一些无法预见的适配问题,而由于适配导致系统故障会被追究责任。


银监会和央行并没有因国产化替代就降低银行的服务标准,比如停机仍不能超过半小时。此前,大部分银行并不太愿意给自己找麻烦。但这两年,尤其是信息创新的战略提出后,有很多银行加速了这一工作进程。


“这是趋势。”一位金融行业资深人士说。他也向数智前线证实国产技术的可行性,“选好技术方案,找好实施厂商,问题不大。”


也有金融行业人士认为,替换要有一定契机,纯粹为替换是一种资源浪费。根据中国信通院的报告,银行选择国产数据库的原因之一,是技术层面的分布式改造。分布式也是阿里、腾讯、华为、PingCAP等新兴数据库相比甲骨文传统数据库的优势。分布式数据库具有弹性、业务敏捷和成本节约优势,更适合当下的互联网时代。


上述资深数据库人士进一步分析,三年之内,中国城商行的替换完全有可能,但这要求数据库管理和运维的人力是现在行业的5~10倍。“简单来说,我觉得主要还是足够的工程服务能力和决心。”


一位长期从事国产软件的资深人士对数智前线说,甲骨文的生态体系已服务中国金融行业超过20年。接下来,将是这个系统解耦和利益重新分配的过程。“这可能是一个长尾过程。”


市场调研机构Gartner的最新报告称,随着中国本土供应商的能力不断成熟,过去对历史遗留技术替换的态度将发生变化。


国产数据库开始反攻


金融行业的堡垒被突破的同时,业内对国产数据库前景也普遍持乐观态度。


今年,Gartner首次推出了数据库中国市场指南。指南中预测,“到2025年,海外厂商在中国分析型数据库市场的份额将只剩30%,在中国交易型数据库市场也只剩50%左右。”


这意味着,到2025年,中国企业在上述市场至少将达到50%的市占率。


指南中分析,背后驱动因素主要有两个:一是中国数据库企业,包括阿里、腾讯、华为等向云端迁移的速度超过美国及全球水平(见下图),而云原生数据库已取代传统数据库成为市场主流;二是国家信息技术创新发展战略,这也是一个重要驱动因素。


图片来源:Gartner<br>
图片来源:Gartner


“即便不提国产替代,5年10年这个市场也一定是国产数据库主导。”一位国产软件资深人士对数智前线说,“当然,50%可能是市场份额,不是收入份额,毕竟甲骨文卖得贵。”


他对国产数据库在技术和商业上的进步表现得很乐观。像数据库创业公司PingCAP拿下了日本金融机构的大单,而日本银行的服务水准不低;另外蚂蚁集团自研数据库OceanBase于2019年在有着“数据库奥林匹克赛”的TPC-C基准测试中,打破甲骨文保持了 9 年的世界纪录,登顶该榜单至今。


“不仅是市场份额,到2025年,国产数据库连收入都有可能超过进口数据库。”上述资深数据库人士称。


他的理由是,甲骨文在中国市场已经萎缩很多。“实际上只在金融、政企有一些存量市场。除了少数新增订单,基本上大家都不会新购甲骨文。”在甲骨文全球收入里,中国市场的份额只有4%左右。


而甲骨文在全球数据库市场的份额也在不断萎缩,尤其是它没有抓住云的机会。这一点可以从IDC在2021年的报告中得到佐证。早在2020年,阿里云数据库收入在中国关系型数据库市场已超过甲骨文。


在墨天轮的国产数据库流行度排行中,截至2022年2月,PingCAP、华为和蚂蚁的产品分列前三。在Gartner魔力象限中,2021 年,阿里云(Alibaba Cloud)处于云数据库领导者象限,华为云(HUAWEI CLOUD)处于特定领域玩家象限(NICHE PLAYERS),是国内仅有入选的两家。


图:墨天轮国产数据库流行度排行,2022年2月
图:墨天轮国产数据库流行度排行,2022年2月


“如果你去与HAT(华为、阿里、腾讯)数据库的工程师聊,会发现他们今天已经不太care甲骨文了。”上述国产软件人士称。


而数据库资深人士解释,这是因为HAT们已经在一个与甲骨文平行的世界中赛跑。甲骨文在传统信息化时代是个好产品,只是在互联网化、数字化时代,在大数据、低成本、海量分析需求下,已没有那么大优势。在北美,这两个赛道上的企业也不打架。


除了主流的关系型数据库,国产数据库也在进入更多细分行业,比如时序数据库。它主要用于工业物联网场景。“我们的数据库确实在电力、化工、石油一些新项目中,取代海外数据库。”涛思数据创始人陶建辉告诉数智前线。


原先这些场景使用一种名为PI的美国数据库。“这是全世界特别贵的数据库,它在工业上的用量特别大,用于工业流程控制,但国内很少报道。”陶建辉说。



所有国产数据库都在享受当下的红利。整个资本市场对数据库的热度远远超过其他领域。“我认识的很多出来创业的朋友,天使轮的资金量已经超过A轮或B轮,达到亿级。”一位数据库从业者说。据36氪报道,2015年创立的PingCAP以180亿元的估值完成了新一轮融资。



人才也在成倍增加。有互联网大厂告诉数智前线,今年在数据库业务上的校招人数相比2019年是三位数增长,而2019年又是2017年的三位数。


蚂蚁OceanBase开源业务负责人封仲淹也观察到,目前的校招生和社招生都愿意选择基础软件,认为这是一个对职业发展更好的行业。


“但在人才绝对数量上,中国比美国还要少很多,毕竟那里有全球最成功的几大数据库巨头。”一位奔走在中美两地的数据库人士观察说。


国内目前还没有出现在全球市占率达到个位数的数据库企业。国产数据库即便像蚂蚁OceanBase经历了双11极端场景下的运行,要变成一个成熟产品,仍需要一个商业化过程。


另外,国产数据库也没有高度竞争的环境。“目前这个市场上还是条块分割状,比如中信银行、建设银行或者电力部门都自己开发了数据库。”一位数据库资深人士称,目前国内有140多种数据库产品,有些企业虽然没有太大竞争力,但因为利益绑定太深,影响最终的市场格局。


开源算自主可控吗?


不过,在国产数据库的发展中,公众始终有个疑问,国产开源数据库基本都基于海外的开源软件,这是否会面临风险?还能自主可控吗?


目前,大部分国产数据库是从国际开源软件MySQL、PostgreSQL生长出来。其背后的逻辑是,基于这些高起点技术,能加快国产软件研发进程,兼容业务应用,形成下游应用黏连,降低替代难度,快速抢占市场,这也是基础软件实现自主创新的现实可行路径。



根据报道,中国90%以上的开源数据库都是用的MySQL,中国对MySQL生态的依赖程度尤其高。


但MySQL多年前已经被甲骨文收购。而甲骨文创始人拉里·埃里森对中国的态度并不算友好,言语中时常情绪化。另外,开源的MySQL并未让甲骨文获益太多。在这种背景下,源自MySQL的国产数据库或许会面临系统性风险。


“别的不说,MySQL只要停止更新升级,国产数据库就会有麻烦。”一位长期在国产软件行业工作的人士说。此前,美国软件公司红帽就宣布,在2021年底停止更新旗下的开源操作系统CentOS 8,这在当时对国内众多行业造成了影响。


不过,就目前而言,到底怎样的开源软件属于自主可控,还没有公认的标准。


PingCAP和涛思数据相关人士告诉数智前线,在开源这件事上有两种,一种是自主开源,就像这两家企业的产品源自自己的开源项目,再通过订阅和云服务模式来商业化,并走向全球市场。第二种是引用开,底层基于别人的代码,上面套了一些壳,增加了一些功能,这就是不可控的。


但自主开源有待于国内开发者整体水平的提升。北京开源创新委员会常务副主任、中国开源软件推进联盟副秘书长宋可为告诉数智前线,以操作系统的Linux内核社区为例,社区里中国开发者从早期的30多人到现在最多400多人做提交。中国开发者的贡献比例从最早的不到2%,最高达到14%,现在稳定在11%左右。


目前,该社区中,中国开发者是所有国家里贡献最高的。


图片由北京开源创新委员会常务副主任宋可为提供<br>
图片由北京开源创新委员会常务副主任宋可为提供


“开源软件是一个重要契机,我们曾是最大受益者。但目前,在美国相对保守,又开始给大家画圈的情况下,我们应该站出来,去团结世界上愿意与中国去做科技创新的开发者,共同创新。”宋可为称。


而一位资深国产软件人士观察道,要给开源更多的包容,这样才能让自主开源蓬勃发展起来。


本文来自微信公众号:数智前线(ID:szqx1991),作者:赵艳秋