摘要: 放到更长(zhang)的时间线里,一切也(ye)才刚刚开(kai)始。

01

“我们还是回滚到Oracle吧。”马来西亚最大(da)电商公司之一PrestoMall的数据(ju)工程(cheng)师敲下这(zhei)句(ju)话后,阿里云架构师郑旦(dan)和(he)在吉隆(long)坡、北(bei)京、杭州三地的同(tong)事们,面(mian)临着3个月工作一夜归零的险境。

2019年(nian)12月6日的(de)(de)凌晨(chen)4点(dian)(dian),本该(gai)在(zai)0点(dian)(dian)启(qi)动(dong)的(de)(de)数(shu)(shu)据库迁移行动(dong),推迟(chi)了4个(ge)小时。他们要(yao)将公司成立5年(nian)来的(de)(de)所有线上(shang)交易、线下分析报(bao)表数(shu)(shu)据从(cong)Oracle数(shu)(shu)据库切换到阿里云的(de)(de)数(shu)(shu)据库PolarDB上(shang)。数(shu)(shu)据总量超过5T,类似5年(nian)时间不间断,每秒300多笔(bi)记录,所累积的(de)(de)数(shu)(shu)据量。

三个(ge)月前,PrestoMall分布在印度、韩(han)国、大马的研发团队(dui),以及唯一(yi)一(yi)位(wei)数(shu)(shu)据(ju)(ju)(ju)库工程师,都觉得这个(ge)想法太疯狂了(le)。5T数(shu)(shu)据(ju)(ju)(ju)的迁移绝不是(shi)小(xiao)事,更(geng)何况数(shu)(shu)据(ju)(ju)(ju)库涉及所有线上核(he)心业(ye)务(wu),而任(ren)何的数(shu)(shu)据(ju)(ju)(ju)差错,都会带(dai)来业(ye)务(wu)问题。而且他们新选的数(shu)(shu)据(ju)(ju)(ju)库供应商(shang)来自阿里巴巴,后(hou)者旗下的Lazada 可(ke)是(shi)他们的竞争对手(shou)。

但PrestoMall还是做出了决(jue)定——上云!

之前PrestoMall使(shi)用(yong)的(de)32核Oracle数(shu)据库(ku),屡屡遇到(dao)问题,高峰时(shi)间段在线(xian)交易的(de)瞬间激增、大量(liang)数(shu)据的(de)持续存储(chu),让业务随时(shi)处于崩溃的(de)边缘。2019年12月,PrestoMall的(de)Oracle许可证(zheng)将到(dao)期,是否继续沿用(yong)的(de)问题,提前被提上议程(cheng)。

如果切换上云成(cheng)功(gong),PrestoMall预期可(ke)以节省90%的(de)数(shu)据(ju)库费用,相(xiang)关的(de)IT成(cheng)本也有望下降40%。因此(ci),在(zai)9月初,公司开始与东南亚(ya)市(shi)场上的(de)数(shu)据(ju)库供应商接(jie)触(chu)。

权威机(ji)构Gartner报告(gao)显示,微软Azure、亚马逊AWS、阿(a)里云Alibaba Cloud是云数(shu)据(ju)库份额前三厂商,因为(wei)都是A开头(tou),简称3A。作为(wei)亚洲增速最快的(de)经济体之一,东南亚市场是必争之地。

从当地(di)工(gong)程师的(de)(de)认知上讲,微软Azure总(zong)体品牌(pai)认知度最(zui)高,本身(shen)有SQLServer的(de)(de)长期积淀,亚马(ma)逊AWS的(de)(de)Aurora是(shi)最(zui)早商用的(de)(de)云数据库(ku),具有性能上的(de)(de)口碑,并(bing)且也(ye)脱胎于(yu)电商业务。

无(wu)论找(zhao)谁,用云数(shu)据库替代Oracle等(deng)传(chuan)统(tong)数(shu)据库都是势在必行。

阿里巴巴副总裁、达摩(mo)院(yuan)数据库首席科(ke)学(xue)家李(li)飞飞是攻下市场的(de)关(guan)键角色。

李飞(fei)飞(fei)曾经是犹他大(da)学终身(shen)教(jiao)授任、ACM杰(jie)出科学家(jia),在(zai)数据库领域拥有非常大(da)的(de)影响(xiang)力,2018年李飞(fei)飞(fei)加入(ru)阿(a)(a)里(li)(li)巴(ba)巴(ba),现任阿(a)(a)里(li)(li)云(yun)数据库负(fu)责人(ren),花名:飞(fei)刀。

“今年要帮助(zhu)1000家企业(ye)去O,10000套传统数据仓(cang)库(ku)上云。”李飞(fei)(fei)飞(fei)(fei)在2020年6月9日对外公布了一(yi)组数字(zi)。这个(ge)目标不是(shi)单方面的(de)商业(ye)计划,而(er)是(shi)基于(yu)客户表达的(de)强烈需求(qiu)。李飞(fei)(fei)飞(fei)(fei)这一(yi)发言具有全球(qiu)指标性意义(yi)。

“他的英语(yu)交(jiao)流出色,在(zai)数据库领域又(you)有科学(xue)家和(he)大(da)公司团队(dui)负责(ze)人双重身(shen)份,客户很容易认可。”架构(gou)师西壁说,李(li)飞(fei)飞(fei)花了大(da)量时间,帮助东(dong)南亚(ya)销售团队(dui)与客户接(jie)触。

阿(a)里巴(ba)(ba)巴(ba)(ba)数(shu)据库团队很少坐(zuo)下来(lai)向(xiang)客(ke)户做长篇演说推广。西壁(bi)认为他(ta)们的竞争优势在(zai)于:“第(di)一是场景(jing),PolarDB已(yi)经支持双11多年,秒杀(sha)、直(zhi)播(bo)等(deng)场景(jing)也都是客(ke)户感兴趣的;第(di)二(er)是直(zhi)接(jie)让(rang)客(ke)户到自己系统中试用,接(jie)受检验。”

根据(ju)PrestoMall的需求,9月末(mo),阿里(li)和(he)其(qi)他厂商(shang)一起提(ti)交了“去O”的迁移方案以及兼容性评测报告。然而(er),评测结果(guo)是(shi)PolarDB产品由于采(cai)用分布(bu)式架构(gou),当时(shi)版本对(dui)Oracle数(shu)据(ju)兼容性相对(dui)低,以及价(jia)格还更高。

坚持采用(yong)分(fen)布(bu)式架构,而(er)不是(shi)只照(zhao)顾兼容(rong)性,是(shi)李飞飞加入数据库团队后,与各个骨干达(da)成的(de)(de)共识。因为这种(zhong)架构能(neng)支持不同(tong)(tong)类型的(de)(de)数据库,共同(tong)(tong)高效调用(yong)资(zi)源。当(dang)时,团队刚刚快速从(cong)过去兼容(rong)MySQL的(de)(de)PolarDB数据库产品中,抽出了(le)一款针对Oracle客户快速切换的(de)(de)产品PolarDB-O。

当时,PolarDB-O尚在公测期,李飞飞竟然(ran)就(jiu)(jiu)要面向国际客户服务(wu)。郑旦(dan)在阿(a)里(li)巴(ba)巴(ba)有7年数据库架构师经(jing)验(yan),完成了(le)多个事业部的“去O”;这个目标仍然(ran)让她感到“太快了(le)”——“当时,团队(dui)刚(gang)刚(gang)改变建制,我突(tu)然(ran)就(jiu)(jiu)被拉到一个群,说你去负(fu)责这个马来西(xi)亚(ya)客户。”

东南亚项目容易“费力不讨好”。语言、编程(cheng)习惯、3A的疯狂竞争(zheng)、远程(cheng)成本……各(ge)种因素随时都可能让项目夭(yao)折。

为了最终迁移顺利,郑旦团队和多个(ge)研发小组,甚至要计划在上海完全(quan)模拟了一套复(fu)刻客户同体量(liang)的数据(ju),模拟从Oracle迁移的每(mei)一个(ge)细微环节。

但由于(yu)评测报告并不占优,接下来的工(gong)作只(zhi)能提(ti)速。数据库(ku)相关团队整(zheng)个国(guo)庆(qing)加班迭代(dai),并派出多(duo)名成员(yuan)前往马(ma)来西亚。阿里云智(zhi)能总(zong)裁(cai)行癫(dian)曾经对内多(duo)次谈到,核心(xin)技术大件放到国(guo)际上竞争(zheng),绝不能只(zhi)靠“价格低”、“阿里出品(pin)”来吸引客(ke)户。

经过(guo)现场对(dui)未(wei)来场景(jing)的(de)几轮商(shang)谈,阿里(li)丰富的(de)电商(shang)实践检验,最(zui)终更(geng)有说(shuo)服力。但无论郑旦(dan)们,还是Prestomall的(de)工(gong)程(cheng)师们,仍然感觉到巨大的(de)不确定性。

02

阿(a)里(li)云数据库团队对东南亚(ya)市场(chang)并不陌生,心(xin)(xin)(xin)动(dong)(dong)网(wang)(wang)(wang)络(luo)就是阿(a)里(li)云服务的(de)客户之一。在(zai)热门的(de)游戏(xi)出(chu)海领域(yu),心(xin)(xin)(xin)动(dong)(dong)网(wang)(wang)(wang)络(luo)打造了(le)游戏(xi)社区TapTap,近几年在(zai)海外(wai)的(de)扩张(zhang)势头也格外(wai)凶猛(meng),《碧蓝航线》《第五人格》等国内爆款游戏(xi)均通过心(xin)(xin)(xin)动(dong)(dong)网(wang)(wang)(wang)络(luo)与国外(wai)玩家见面。

一直以来,游戏出(chu)海行业里关(guan)注更多的是(shi)如何获取海外(wai)流(liu)量、如何内容本(ben)地(di)化,鲜少有人(ren)关(guan)注讨论(lun)在(zai)线娱乐型流(liu)量的底(di)层支(zhi)撑与命门——数(shu)据(ju)库和数(shu)据(ju)仓库。前者支(zhi)撑和记录玩(wan)家的所有交(jiao)互行为;后(hou)者则要将大数(shu)据(ju)实时提供给运营团队数(shu)据(ju)洞察,便于做(zuo)出(chu)及时的玩(wan)法和策略调(diao)整。

TapTap的全(quan)球化运营(ying)与交(jiao)付模(mo)式,意味着他们(men)需(xu)要有支(zhi)撑各区域部署的“数字大脑”,而相互(hu)之间,又最好使(shi)用(yong)统一的大件模(mo)块。

然而伴随着业(ye)务的(de)扩(kuo)张(zhang),互联网(wang)公(gong)司原有的(de)大量MySQL数据(ju)库面临(lin)挑战,数据(ju)备份慢、业(ye)务延迟(chi)大,游戏发版前对数据(ju)备份动辄需要几小时,非常影响发布效(xiao)率(lv)。心动网(wang)络最(zui)早在东南(nan)亚市(shi)场(chang)使用了亚马逊AWS Aurora。

随(sui)着(zhe)阿(a)里云自(zi)研的云原(yuan)生(sheng)数据(ju)库PolarDB在(zai)当地开(kai)设服务,心动网(wang)络选择了这一成(cheng)本更低、性能(neng)更优、曾(ceng)经(jing)扛住了双11大(da)规模高并发的伙伴(ban)。

从MySQL到(dao)AWS Aurora再(zai)到(dao)PolarDB,必须平衡数据(ju)库(ku)迁(qian)移(yi)诸多细节(jie)、稍有差池(chi)后果不堪设(she)想(xiang)。为此,阿里云有两个(ge)重要的迁(qian)移(yi)工具保障这个(ge)过程(cheng),DTS用(yong)于数据(ju)的迁(qian)移(yi)、ADAM用(yong)于业务(wu)层相关的迁(qian)移(yi)。两个(ge)产(chan)品对主流数据(ju)库(ku)种类(lei)的支(zhi)持(chi)规模(mo),都是业内最高。

而另(ling)一(yi)家游戏(xi)出海领(ling)头羊莉莉丝,代(dai)表作包括《万国觉醒》《劍与远(yuan)征》,则在两年前就开始利用阿里(li)云的云原生数(shu)据(ju)仓(cang)库AnalyticDB,帮助数(shu)据(ju)架构师和(he)(he)运营(ying)人员及时分析游戏(xi)运行(xing)情况,及时调整(zheng)策略。这个数(shu)据(ju)仓(cang)库产品(pin),也在2020年拿(na)下TPC-DS性(xing)能榜(bang)全球第一(yi)的桂冠,代(dai)表着(zhe)性(xing)能和(he)(he)性(xing)价比的巅峰(feng)水(shui)平。

互(hu)联网数据处理和(he)存储场(chang)景越来越要求弹性、智能化。PrestoMall、心动(dong)网络(luo)、莉莉丝冒着(zhe)风险更换数据库的选择也并非(fei)个例。

相比之下(xia),“去O”的趋势(shi)虽(sui)然已经明朗,但趋势(shi)归趋势(shi),要从Oracle迁移(yi)数(shu)据(ju)的难度(du),其(qi)实大大复杂于其(qi)他开(kai)源数(shu)据(ju)库。

郑旦表(biao)示,因为Oracle数据库版本(ben)繁多,不同客(ke)户创建报表(biao)的(de)逻辑差异(yi)很大,基于DTS和ADAM产品,PrestoMall项(xiang)目需(xu)要改动的(de)代码不到5%,但仍然带来不少升级优化需(xu)求(qiu)。

03

数据(ju)库的(de)市场并不大,却聚集了全球高科技(ji)巨头核心(xin)的(de)研(yan)发力量。

据不同的统计口(kou)径,全球数(shu)据库市场规模(mo)在300亿(yi)美(mei)(mei)金到(dao)600亿(yi)美(mei)(mei)金之间(jian)。相比于全球云计算(suan)数(shu)千亿(yi)美(mei)(mei)元(yuan)级别的规模(mo),这不算(suan)是最大的一块(kuai)肥(fei)肉。

但数据(ju)(ju)库(ku)的(de)(de)(de)战(zhan)略位置十分特殊,其(qi)承载了一个企业(ye)客(ke)户最核心的(de)(de)(de)数据(ju)(ju)资产,而每一次迁移(yi),都意味着相当的(de)(de)(de)风险。数据(ju)(ju)库(ku)的(de)(de)(de)选择(ze),往往也也会影响企业(ye)对存储、服(fu)务(wu)器(qi)等其(qi)他(ta)大(da)件的(de)(de)(de)消费(fei),粘(zhan)性高、撬动后(hou)续(xu)服(fu)务(wu)的(de)(de)(de)能力强。

微(wei)软(ruan)、Oracle、SAP、亚(ya)马逊AWS、Google、IBM、阿里巴(ba)巴(ba)、腾讯、华为……全球顶级(ji)科技巨(ju)头在数(shu)(shu)据(ju)库领域已经鏖战了数(shu)(shu)十载,亚(ya)马逊AWS的(de)CTO Werner Vogels更是(shi)多(duo)次强调:“数(shu)(shu)据(ju)库是(shi)云计算的(de)终极之战(Real Battle)。”

如果要用(yong)云数(shu)据(ju)库取(qu)代传统数(shu)据(ju)库,这相当于将现有(you)每年(nian)数(shu)据(ju)库500亿美元(yuan)(yuan)市(shi)场中,约70%的(de)份额分流。按照行业预测增速(su),未(wei)来三年(nian)数(shu)据(ju)库市(shi)场总销(xiao)售额约在(zai)1800亿元(yuan)(yuan)。

从商(shang)业数据库(ku)到(dao)开源数据库(ku)、云原生数据库(ku),从海外巨(ju)头占绝对主导地位到(dao)如今(jin)国内外头部玩家在新赛道(dao)上同(tong)步(bu)起跑,当下的(de)(de)数据库(ku)和十年(nian)前的(de)(de)数据库(ku)已然(ran)不是同(tong)一个概念。

历(li)史上,最(zui)早的数据(ju)库要追溯到20世纪70年代(dai),1968年IBM推出了(le)第一代(dai)数据(ju)库DB1,1970年IBM工程(cheng)师(shi)EdgarCodd写(xie)下了(le)最(zui)早的关系型数据(ju)模型构想的论文(wen)。随后的30年间(jian)出现了(le)Oracle、Informix、Sybase、Sybase与微软合作(zuo)的SQLServer等著名的数据(ju)库公司。

全球数据(ju)库产业在(zai)2000年(nian)前后进行了第一次大战并主要形成(cheng)IBM、微软、Oracle三巨头格局,那也是商业数据(ju)库的(de)时代(dai)。

2000年以后,互联网(wang)和云(yun)(yun)计(ji)算(suan)技(ji)术变革为(wei)数据(ju)库技(ji)术带来了“釜底抽薪”的(de)底层计(ji)算(suan)系统(tong)变化,带来了以开源、分布式和云(yun)(yun)计(ji)算(suan)为(wei)主(zhu)导(dao)的(de)新数据(ju)库时代。

2018年10月,阿(a)里(li)云(yun)第一次出现在Gartner全球数(shu)据(ju)(ju)库魔(mo)力象限(包(bao)括传(chuan)统和云(yun)数(shu)据(ju)(ju)库市(shi)场份额(e))。第二(er)年,阿(a)里(li)云(yun)就成为最接近“领(ling)导者”象限的“挑战(zhan)者”,整个市(shi)场呈现7强格局(ju):微(wei)软、Oracle、SAP、AWS、Google、IBM和阿(a)里(li)云(yun)。

在数(shu)据(ju)(ju)(ju)(ju)量很少的(de)时(shi)候(百GB),传统的(de)数(shu)据(ju)(ju)(ju)(ju)库如SQLServer、Oracel、DB2等可以完成大多(duo)(duo)数(shu)场景(jing)对数(shu)据(ju)(ju)(ju)(ju)管理的(de)要求(qiu)。但随着数(shu)据(ju)(ju)(ju)(ju)越(yue)来越(yue)多(duo)(duo)、负载越(yue)来越(yue)高、对数(shu)据(ju)(ju)(ju)(ju)分析的(de)需求(qiu)开始出现,企业(ye)意识到(dao)了(le)商业(ye)数(shu)据(ju)(ju)(ju)(ju)库的(de)局限性。

这(zhei)时候云原生(sheng)数(shu)(shu)据(ju)库厂商开始把商业数(shu)(shu)据(ju)库以(yi)及开源的数(shu)(shu)据(ju)库搬到(dao)(dao)云上,给客户(hu)以(yi)租用(yong)的方式(shi)提供服(fu)务。云原生(sheng)数(shu)(shu)据(ju)库更是有(you)目共睹——低成本、免部署运(yun)维、高(gao)性(xing)能、更安全,Gartner预测,到(dao)(dao)了2021年,云数(shu)(shu)据(ju)库在整个数(shu)(shu)据(ju)库市场中的占比将首(shou)次达到(dao)(dao)50%,而到(dao)(dao)了2023年,75%的数(shu)(shu)据(ju)库都要跑在云平台之上。

全球顶级科技(ji)公司的新(xin)一(yi)轮(lun)数据库“世(shi)界大战(zhan)”围绕于(yu)此(ci)。

Oracle和(he)(he)Microsoft原本以(yi)数据库见长,在(zai)(zai)云时代(dai),两家公(gong)司(si)都在(zai)(zai)努力从私有环境部署向云上(shang)转型(xing);AWS、Google和(he)(he)阿里(li)云则(ze)是在(zai)(zai)云上(shang)取得了(le)成功。逐渐(jian)地,抓住了(le)“云机会”的3A(AWS、Azure、阿里(li)云)和(he)(he)Oracle形(xing)成了(le)新的头部数据库格(ge)局。

其中,阿里(li)云(yun)PolarDB系列数据库,从(cong)2015年项目启动,经(jing)过几年天(tian)猫(mao)双11的试炼,已经(jing)进入(ru)快速商业化轨道。也就在昨天(tian),李(li)飞飞向外宣布,PolarDB系列已经(jing)成(cheng)为(wei)增速最快的云(yun)产品之一。

据了解,最近几(ji)个(ge)月这个(ge)系列(lie)数据库产品(pin)同比增速都超过300% 。

04

而云(yun)数据库(ku)的崛起,其实(shi)是整(zheng)个互联网场景(jing)变化与趋势发展的缩影。

在2004年左右,阿里巴巴尚未涉(she)足云计(ji)算,这家“电商公司”当时还是数据(ju)库(ku)的(de)大买主。

“技(ji)术人(ren)员们花钱(qian)如流(liu)水,买得「IOE」(IBM的(de)小型(xing)机、Oracle数(shu)据库(ku)、EMC存储设备(bei))这三家(jia)的(de)对(dui)口销售年(nian)年(nian)升职。”据《淘宝技(ji)术这十(shi)年(nian)》中阿里巴巴技(ji)术人(ren)员的(de)回忆(yi),互联(lian)网实(shi)在发展(zhan)得太快,很快就超过了(le)IOE的(de)极(ji)限,哪怕花钱(qian)也无法解(jie)决问(wen)题。传统数(shu)据库(ku)本(ben)质(zhi)上是单机系统,即(ji)便做了(le)分(fen)库(ku)分(fen)表,也无法改变单机系统的(de)本(ben)质(zhi)。

2007年左右,阿里B2B业务势头正盛,淘宝、支付宝也出现井喷式增长(zhang)。反(fan)应迟钝的传(chuan)统软、硬件供应商(shang)拿不出解(jie)决(jue)方(fang)案,阿里巴巴需要“自救”。

2008年9月,王坚加盟阿里巴巴集团担任首席架(jia)构师,也首次提出去IOE。但(dan)这一想法在当(dang)时被很多人(ren)认为(wei)是天方夜(ye)谭。据了解,在数据团队整合的(de)过(guo)程中,走了三个主管,刚提起来,一周不(bu)到就辞职了。

当电商业务逻辑变复杂(za)以(yi)后,需(xu)要理解(jie)Oracle数(shu)据库的技术实(shi)现,但(dan)无论是(shi)请Oracle专家到现场的时间还是(shi)成本都无法满足(zu)业务要求(qiu),于是(shi)阿里(li)巴(ba)巴(ba)从2012、2013年后就开始大规模使用、定制开源数(shu)据库。

这是一(yi)个很有意思(si)的(de)现象。当今格局中头部(bu)的(de)AWS与阿里云背后,都是电(dian)商基因的(de)支撑。双十一(yi)等超大规模场景,在(zai)世界范(fan)围(wei)内(nei)来(lai)看都绝无仅有,这也给了中国电(dian)商企业登顶(ding)全球基础软件技术领导地(di)位(wei)的(de)机会。

在2019年双(shuang)11的(de)交易中,PolarDB数据库处(chu)理(li)交易事件(jian)的(de)峰(feng)值更是达到了8700万次/秒。

2011年(nian)加入(ru)阿里(li)的离哲(zhe),现任AnalyticDB等智能分析(xi)类数据库业(ye)务负责人,几乎见证了阿里(li)数据库各种业(ye)务应(ying)用和自研阶段。

离哲表示:“2012年(nian)的(de)时候(hou)商(shang)家进货很(hen)有挑战。该进什么(me)样(yang)的(de)货,黑色(se)好(hao)卖(mai)还是白色(se)好(hao)卖(mai),商(shang)品起什么(me)标题(ti)……问题(ti)很(hen)多(duo)。我(wo)们(men)怎么(me)帮商(shang)家解决这(zhei)些(xie)问题(ti)?最终这(zhei)些(xie)问题(ti)指向了一个(ge)数据分析和面(mian)向未来的(de)趋势,所以我(wo)们(men)开(kai)始尝试(shi)用(yong)开(kai)源(yuan)技术做这(zhei)个(ge)功能。”

2013年,离哲团队多次争(zheng)取,获得(de)了一个大数据(ju)项目,完(wan)全把数据(ju)的分(fen)析能力(li)透传(chuan)给商(shang)家、广告主,能让(rang)他(ta)们去(qu)做精准营销(xiao)。

从2014年开始,其数(shu)据分析能力走(zou)出了(le)阿里巴巴。

第一个(ge)客户(hu)中(zhong)信21世纪(也就是(shi)后(hou)来的(de)阿(a)里(li)健康)面临的(de)问题上药物条码。药的(de)流(liu)通是(shi)个(ge)很大的(de)问题,药物真(zhen)假溯(su)源尤(you)为重要。但如果整体“上云”,这个(ge)数据(ju)量(liang)是(shi)极(ji)大的(de)。

第二(er)个客(ke)户(hu)线上打车(che)的业务是实时的,除了处理业务数(shu)据,同时由于有红包功(gong)能,整个数(shu)据分析还需要对抗薅羊毛(mao)的黑产(chan)和灰产(chan)。

日积(ji)月累,客(ke)户的数量越(yue)来越(yue)多。

“服务外部的(de)时(shi)候(hou)我们发现很多(duo)行业,比如游(you)戏、税(shui)务,他们都(dou)(dou)面临同(tong)样的(de)问(wen)题——当传统(tong)数(shu)据(ju)量变大的(de)时(shi)候(hou)怎么用数(shu)据(ju)去赋能业务、用数(shu)据(ju)解(jie)决业务问(wen)题。例如游(you)戏行业里(li)大多(duo)数(shu)游(you)戏生命周期都(dou)(dou)很短,一般6-8个月(yue),怎么在(zai)短时(shi)间内做精准投放、快速引流并留存用户让(rang)投入(ru)价值(zhi)最大化。”离哲说(shuo)。

AnalyticDB这类提供(gong)智(zhi)能分(fen)析(xi)的(de)数(shu)据(ju)(ju)(ju)仓(cang)库,成(cheng)为衔(xian)接客户(hu)数(shu)据(ju)(ju)(ju)和大(da)数(shu)据(ju)(ju)(ju)分(fen)析(xi)能力的(de)关键组件。而Gartner报(bao)告也指出,对(dui)于未(wei)来的(de)数(shu)据(ju)(ju)(ju)工程师,数(shu)据(ju)(ju)(ju)运维工作量会(hui)下降(jiang)30%,智(zhi)能化的(de)分(fen)析(xi)能力则会(hui)大(da)幅提升(sheng)。AnalyticDB在复杂查(cha)询场景比传(chuan)统(tong)关系(xi)型数(shu)据(ju)(ju)(ju)库快10倍以上。

不(bu)过,拥抱新的(de)云原(yuan)生(sheng)(sheng)数据(ju)库,并(bing)不(bu)是一件困难的(de)事。国(guo)内(nei)第一位(wei)Oracle ACE及Oracle ACE总监,云和恩墨创(chuang)始人盖国(guo)强在(zai)三年(nian)前(qian)就在(zai)积极推行云原(yuan)生(sheng)(sheng)框架。

盖国强团(tuan)队是国内数(shu)据库社区(qu)最(zui)顶尖的贡献者之一,他归(gui)纳了数(shu)据库行业的几个重要趋(qu)势:

分布式。弹性伸缩,故障自愈。

智(zhi)(zhi)能(neng)。智(zhi)(zhi)能(neng)优(you)化,智(zhi)(zhi)能(neng)运维。

平台(tai)化。用户(hu)可以自己去建所有东西,进(jin)行统一管理。

软(ruan)硬一体。将(jiang)所有东西集成在一起,让用户能够(gou)获(huo)得极致的性能和便利(li)。

云化融合。云上和云下越(yue)来越(yue)趋于(yu)统一。

05

这(zhei)是一(yi)个好时代。

作为云技(ji)术的(de)基础设(she)施,数据库(ku)成为了新(xin)一轮全球科技(ji)竞(jing)赛的(de)必争之地,也毫无疑问(wen)地是(shi)企(qi)业(ye)进一步数字化(hua)、走向(xiang)更高(gao)效率(lv)的(de)桥头堡。

而(er)云的(de)弹性和云的(de)本质(zhi)又(you)让(rang)我(wo)们有机(ji)会通过(guo)存储计算分(fen)离重新定义数据库(ku)。在这(zhei)条赛道上,全球(qiu)玩家都是同步起跑(pao)。中国巨(ju)大(da)的(de)人口(kou)基(ji)数带(dai)来了足够丰富的(de)场景让(rang)数据库(ku)的(de)性能(neng)能(neng)够得到校(xiao)验,新基(ji)建所(suo)对应的(de)数字(zi)化浪(lang)潮也(ye)正澎湃汹涌。

回到半年之前(qian)的(de)那个凌晨(chen),郑旦团队(dui)几次进(jin)入(ru)艰难读(du)秒。

深(shen)层的(de)原因,是(shi)传(chuan)统数(shu)据库的(de)架(jia)构限制(zhi),这显(xian)示出变(bian)化的(de)紧迫性。由于PrestoMall使用传(chuan)统数(shu)据库架(jia)构非常简单,并没(mei)有分离处理实时交(jiao)易和(he)离线数(shu)据汇总(zong)的(de)业务(wu),晚(wan)间(jian)交(jiao)易业务(wu)减(jian)少,但数(shu)据报(bao)表仍然在(zai)汇总(zong)。而(er)一旦进入白(bai)天,线上交(jiao)易量(liang)增加(jia),迁(qian)移(yi)的(de)难度提升可想而(er)知。

好在一(yi)切顺利。凌(ling)晨6:10,陪着当地客户负(fu)责人(ren)身(shen)边的项目销(xiao)售人(ren)员带来好消息,新的数(shu)据流可以完全接入(ru)PolarDB,除(chu)了(le)最后的一(yi)些第三方海外邮件(jian)服务外,Oracle数(shu)据库上其他服务全部接入(ru)到(dao)了(le)PolarDB。

迁移(yi)结束后的12月(yue),PrestoMall顺利扛过了(le)双十(shi)(shi)二(er)和(he)圣诞两场(chang)大促。几个(ge)月(yue)间,PolarDB系(xi)列,又顺利完(wan)成十(shi)(shi)几个(ge)版本迭代,正在(zai)金融、电(dian)信、政务等数十(shi)(shi)个(ge)不同行业(ye)类型的客户中部署使用。

数据库的(de)硝烟(yan)从未消弭。放到(dao)更长(zhang)的(de)时间线(xian)里(li),一切(qie)才刚刚开始。