海量數(shù)據(jù)爆發(fā),創(chuàng)新業(yè)務(wù)飛速發(fā)展,當(dāng)前金融行業(yè)正處在巨大的IT架構(gòu)變革與緊迫的數(shù)字化轉(zhuǎn)型時(shí)期,銀行、保險(xiǎn)等金融機(jī)構(gòu)面臨著諸多問(wèn)題,業(yè)務(wù)架構(gòu)如何調(diào)整,是集中式,還是分布式?異構(gòu)系統(tǒng)如何管理?底層數(shù)據(jù)庫(kù)該如何選型?
日前,ITPUB聯(lián)合騰訊云組織了一場(chǎng)小型交流會(huì),邀請(qǐng)了騰訊云數(shù)據(jù)庫(kù)高級(jí)架構(gòu)師田清波、微眾銀行數(shù)據(jù)庫(kù)平臺(tái)負(fù)責(zé)人胡盼盼、光大銀行數(shù)據(jù)中臺(tái)團(tuán)隊(duì)負(fù)責(zé)人王磊及眾多銀行專(zhuān)家一起探討交流,尋找答案。
1 業(yè)務(wù)系統(tǒng)分布式改造
田清波介紹,在技術(shù)架構(gòu)層面,目前國(guó)內(nèi)大多數(shù)銀行主要以國(guó)外廠(chǎng)商提供的大型主機(jī)和數(shù)據(jù)庫(kù)解決方案來(lái)進(jìn)行系統(tǒng)構(gòu)建。而以國(guó)外大型主機(jī)和數(shù)據(jù)庫(kù)為核心的傳統(tǒng)集中式架構(gòu)已無(wú)法滿(mǎn)足日益增長(zhǎng)的大規(guī)模交易和數(shù)據(jù)處理的需求。,可以通過(guò)去彈性支撐此類(lèi)相較之下:傳統(tǒng)的集中式架構(gòu)一方面,性能無(wú)法滿(mǎn)足業(yè)務(wù)爆發(fā)式增長(zhǎng)的處理需求,存在系統(tǒng)過(guò)載風(fēng)險(xiǎn)。另一方面,價(jià)格比較昂貴,維護(hù)成本居高不下。
騰訊云數(shù)據(jù)庫(kù)高級(jí)架構(gòu)師田清波
此外,以手機(jī)銀行、網(wǎng)上理財(cái)、互聯(lián)網(wǎng)保險(xiǎn)等為代表的金融業(yè)務(wù)創(chuàng)新快速發(fā)展,推動(dòng)新技術(shù)正以前所未有的速度與力度發(fā)生深層次變革。
技術(shù)發(fā)展,對(duì)金融服務(wù)模式帶來(lái)重大影響,金融行業(yè)向數(shù)字化、分布式架構(gòu)轉(zhuǎn)型成為必然。“金融業(yè)務(wù)創(chuàng)新與科技創(chuàng)新正在相互促進(jìn),重塑金融行業(yè)系統(tǒng)能力?!碧锴宀ㄖ赋觥?/p>
與會(huì)專(zhuān)家均指出金融行業(yè)業(yè)務(wù)系統(tǒng)進(jìn)行分布式改造除了技術(shù)上的需求,也有政策的原因。隨著外部環(huán)境變化,國(guó)內(nèi)對(duì)自主可控的要求越來(lái)越高,原來(lái)的單體集中式架構(gòu)過(guò)度依賴(lài)于專(zhuān)有設(shè)備,去IOE的大勢(shì)下,大型機(jī)的退出已成定局,金融機(jī)構(gòu)在尋找高可靠、高性?xún)r(jià)比的可替代方案。
國(guó)產(chǎn)數(shù)據(jù)庫(kù)產(chǎn)品逐漸成熟,金融機(jī)構(gòu)有了更多選擇。據(jù)中信證券預(yù)測(cè),到2024年中國(guó)數(shù)據(jù)庫(kù)市場(chǎng)規(guī)模為533億元。據(jù)安信證券對(duì)數(shù)據(jù)庫(kù)國(guó)產(chǎn)化市場(chǎng)進(jìn)行測(cè)算,國(guó)產(chǎn)化數(shù)據(jù)庫(kù)替換市場(chǎng)總體規(guī)模約為3000億元。
2 國(guó)產(chǎn)數(shù)據(jù)庫(kù)突出重圍
從關(guān)系型數(shù)據(jù)庫(kù)到NoSQL,再到NewSQL,國(guó)產(chǎn)數(shù)據(jù)庫(kù)產(chǎn)品早非吳下阿蒙。“沿著同樣的路線(xiàn)再造一個(gè)Oracle根本不可能,也沒(méi)有意義”成為國(guó)內(nèi)數(shù)據(jù)庫(kù)從業(yè)者的共識(shí),分布式數(shù)據(jù)庫(kù)被認(rèn)為是變道超車(chē)的機(jī)會(huì)。
未來(lái)是分布式數(shù)據(jù)庫(kù)的時(shí)代。無(wú)論是傳統(tǒng)的數(shù)據(jù)庫(kù)廠(chǎng)商,還是云廠(chǎng)商,以及新的數(shù)據(jù)庫(kù)創(chuàng)業(yè)者,都轉(zhuǎn)向了分布式數(shù)據(jù)庫(kù)進(jìn)行相關(guān)布局,經(jīng)過(guò)多年的發(fā)展也取得了一些亮眼的成績(jī)。去年,騰訊云數(shù)據(jù)庫(kù)正式進(jìn)入Gartner云數(shù)據(jù)庫(kù)管理系統(tǒng)魔力象限,躋身世界級(jí)數(shù)據(jù)庫(kù)行列。
騰訊云企業(yè)級(jí)分布式數(shù)據(jù)庫(kù)TDSQL隨著騰訊業(yè)務(wù)規(guī)模不斷擴(kuò)大而發(fā)展起來(lái),逐漸對(duì)外商用落地。騰訊云企業(yè)級(jí)分布式數(shù)據(jù)庫(kù)TDSQL涵蓋分布式、分析型、云原生等多引擎融合的完整數(shù)據(jù)庫(kù)產(chǎn)品體系。共有三大產(chǎn)品系列,分別為分布式數(shù)據(jù)庫(kù)TDSQL、分析型數(shù)據(jù)庫(kù)TDSQL-A、云原生數(shù)據(jù)庫(kù)TDSQL-C。
田清波介紹,TDSQL for MySQL和TDSQL for PG兩個(gè)內(nèi)核引擎主打差異化的業(yè)務(wù)場(chǎng)景。其中TDSQL for MySQL專(zhuān)注于聯(lián)機(jī)交易場(chǎng)景OLTP,適用于應(yīng)用程序與數(shù)據(jù)庫(kù)松耦合的場(chǎng)景。TDSQL for PG專(zhuān)注于聯(lián)機(jī)交易場(chǎng)景和復(fù)雜的查詢(xún)場(chǎng)景HTAP,適用于應(yīng)用程序與數(shù)據(jù)庫(kù)緊耦合的場(chǎng)景。
目前,騰訊云企業(yè)級(jí)分布式數(shù)據(jù)庫(kù)TDSQL已經(jīng)支持了中國(guó)銀行、平安銀行、張家港行和微眾銀行等金融機(jī)構(gòu),此外,TDSQL也支撐了第七次人口普查工作。
微眾銀行數(shù)據(jù)庫(kù)平臺(tái)負(fù)責(zé)人胡盼盼
談到具體的落地實(shí)踐,微眾銀行數(shù)據(jù)庫(kù)平臺(tái)負(fù)責(zé)人胡盼盼表示,分布式數(shù)據(jù)庫(kù)的應(yīng)用提高了微眾銀行整體IT架構(gòu)的可靠性與容災(zāi)能力,目前,微眾銀行的TDSQL數(shù)據(jù)庫(kù)規(guī)模有近3000個(gè)實(shí)例,數(shù)百個(gè)核心系統(tǒng)。整體架構(gòu)采用TDSQL 3+2五副本,TDSQL No Shard模式,實(shí)現(xiàn)了高可靠與高可用,同城IDC之間RPO=0,RTO秒級(jí)。
3 分布式改造怎么改?
銀行等金融機(jī)構(gòu)對(duì)于核心系統(tǒng)的改造都非常謹(jǐn)慎。光大銀行數(shù)據(jù)中臺(tái)團(tuán)隊(duì)負(fù)責(zé)人王磊介紹,核心系統(tǒng)改造有兩種選擇,一種是從應(yīng)用層開(kāi)始整體性進(jìn)行分布式架構(gòu)改造,涉及范圍廣,改動(dòng)大,改造后業(yè)務(wù)響應(yīng)更快速,整體更靈活;另一種不需進(jìn)行系統(tǒng)性改造,應(yīng)用分布式數(shù)據(jù)庫(kù),這樣應(yīng)用側(cè)改造少,推進(jìn)快,較為平滑。
光大銀行數(shù)據(jù)中臺(tái)團(tuán)隊(duì)負(fù)責(zé)人王磊
與會(huì)專(zhuān)家指出,如何改造還要根據(jù)企業(yè)組織的業(yè)務(wù)發(fā)展需要,不能為了分布式而分布式,比如,大型銀行進(jìn)行分布式改造,多是為了對(duì)越來(lái)越復(fù)雜的業(yè)務(wù)進(jìn)行劃分,有的小體量銀行可能會(huì)面向未來(lái),為了適應(yīng)業(yè)務(wù)的增長(zhǎng)需求而進(jìn)行分布式改造。
如果決定了做分布式改造,保證業(yè)務(wù)連續(xù)性始終要放在第一位,田清波總結(jié)從技術(shù)層面來(lái)看,核心系統(tǒng)數(shù)據(jù)庫(kù)替換時(shí)一般會(huì)考慮以下五個(gè)方面:
一是業(yè)務(wù)遷移。數(shù)據(jù)能否平滑遷移,遷移效率以及同步性能。遷移后數(shù)據(jù)一致性的校驗(yàn),需要有成熟的遷移工具和遷移方案;
二是安全合規(guī)。滿(mǎn)足金融監(jiān)管要求,實(shí)現(xiàn)金融級(jí)數(shù)據(jù)安全,降低數(shù)據(jù)泄露風(fēng)險(xiǎn);
三是可靠性、可用性。在各種故障災(zāi)難下,保障客戶(hù)數(shù)據(jù)零丟失,保證99.999%的可用性。
四是兼容性。更換數(shù)據(jù)庫(kù)引起的業(yè)務(wù)SQL改造,兼容性適配的額外開(kāi)發(fā)工程;
五是運(yùn)營(yíng)風(fēng)險(xiǎn),數(shù)據(jù)庫(kù)故障時(shí)自助定位解決問(wèn)題的能力,響應(yīng)時(shí)間,排查效率。
在進(jìn)行核心系統(tǒng)改造時(shí)一般分為四個(gè)步驟:
第一步,引入云數(shù)據(jù)庫(kù),應(yīng)用垂直拆分解耦,將業(yè)務(wù)解耦、數(shù)據(jù)解耦,底層使用分布式架構(gòu),增加容錯(cuò)率,整體業(yè)務(wù)的穩(wěn)定性不會(huì)有單點(diǎn)風(fēng)險(xiǎn);
第二步,單體實(shí)例垂直擴(kuò)展。當(dāng)數(shù)據(jù)庫(kù)處理能力不滿(mǎn)足現(xiàn)狀時(shí),可以彈性實(shí)例擴(kuò)容;
第三步,單實(shí)例水平擴(kuò)展,當(dāng)數(shù)據(jù)庫(kù)垂直擴(kuò)展或者讀寫(xiě)分離遇到瓶頸時(shí),可以進(jìn)行分布式擴(kuò)展,應(yīng)用適當(dāng)調(diào)整。
第四步,進(jìn)行單元化改造。據(jù)悉,微眾銀行的核心系統(tǒng)之一進(jìn)行了單元化改造,可以在某單元里做灰度發(fā)布,某個(gè)單元里發(fā)生故障也不會(huì)影響整個(gè)系統(tǒng)。
如今國(guó)產(chǎn)數(shù)據(jù)庫(kù)百花齊放,競(jìng)爭(zhēng)激烈。銀行在選型時(shí)除了關(guān)注數(shù)據(jù)庫(kù)廠(chǎng)商的產(chǎn)品與技術(shù),還會(huì)關(guān)注生態(tài)建設(shè)情況,如數(shù)據(jù)庫(kù)周邊生態(tài),遷移工具等,行業(yè)ISV生態(tài)、軟硬件廠(chǎng)商生態(tài)等。騰訊云數(shù)據(jù)庫(kù)自研的數(shù)據(jù)庫(kù)遷移工具DBbridge可以解決Oracle數(shù)據(jù)遷移工作,已經(jīng)有了很多落地實(shí)踐。
田清波介紹,目前一些大行和股份制銀行更傾向于進(jìn)行單元化改造。而一些城商行更多選擇分布式改造。他認(rèn)為核心系統(tǒng)分布式改造應(yīng)該遵循“先跑通再優(yōu)化,先高頻再跑批,先簡(jiǎn)單再?gòu)?fù)雜”的原則,其中高頻交易占了總交易量的90%,要優(yōu)先集中解決高頻交易問(wèn)題。
在討論的過(guò)程中,有專(zhuān)家指出規(guī)模不大的小銀行沒(méi)有必要進(jìn)行分布式改造,集中式可能更為合適,分布式所帶來(lái)的網(wǎng)絡(luò)開(kāi)銷(xiāo)等成本需要一定的規(guī)模化才可以覆蓋。不過(guò)也有專(zhuān)家認(rèn)為,受自主可控以及相關(guān)政策影響,銀行會(huì)選擇使用分布式國(guó)產(chǎn)化數(shù)據(jù)庫(kù),規(guī)模不大可以進(jìn)行單節(jié)點(diǎn)部署,未來(lái)隨著業(yè)務(wù)的增長(zhǎng)也可以隨時(shí)靈活擴(kuò)展。值得一提的是為滿(mǎn)足不同企業(yè)組織的不同需求,TDSQL for MySQL和TDSQL for PG均支持分布式和集中式部署。
道阻且長(zhǎng),行則將至,在銀行核心業(yè)務(wù)系統(tǒng)改造方面大家都在積極探索,無(wú)論是被動(dòng)還是自主選擇,金融業(yè)核心系統(tǒng)的變革以及國(guó)產(chǎn)化浪潮正滾滾而來(lái)。