阿里云陳威:如何讓銀行的核心系統(tǒng)「拎包上云」?

來源: 雷鋒網
作者:雷鋒網
時間:2021-03-12
17434
在雷鋒網《AI金融評論》與阿里云聯合主辦“銀行系統(tǒng)云化升級”實戰(zhàn)體驗營中,陳威就從阿里云服務金融機構的過往經驗中提取精華,詳盡深入地討論了他們在金融核心系統(tǒng)轉型方面的探索和實踐。

Hippopx (21).jpg

很多金融機構在考慮「上云」與否的時候,并不清楚自己能得到什么。

其實他們最在意的,是希望技術保證核心穩(wěn)定運行,是整體完全自主掌控,是最后達到每單筆交易/每個賬戶成本下降的目標,是在業(yè)務穩(wěn)定性、連續(xù)性不降低的前提下,支撐業(yè)務敏捷。

抽絲剝繭數個實踐合作案例后,我們可以看到,金融機構的訴求,或許可以分為三環(huán):

最難解決的是“1環(huán)”問題,分布式事務怎么實現?各種模式應用在哪些場景?有何利弊?異地多活情況下,數據庫怎么保證良好的支撐?

到了“2環(huán)”,重點落在領域化建模,機構們要參考最佳實踐,思考底層模型框架如何處理,他們也在關心集中化架構——分布式架構——云化架構,有沒有一些特殊的差異?

上升到“3環(huán)”,訴求就會涵蓋整個云化環(huán)境下的運維保障體系、devOps體系、整體的部署架構體系……

2020年被認為是云原生核心的元年,更多金融機構逐漸從混沌中醒來,與科技公司聯手摸索出核心系統(tǒng)的“病灶”所在,對癥下藥。

陳威是阿里云新金融事業(yè)部金融核心部負責人,曾從事企業(yè)級信息技術產業(yè)十余年,具備豐富的應用架構與設計,數據智能,云平臺,互聯網等領域的理論與大型復雜項目實踐,尤其在金融行業(yè)具有多年的交叉實踐經驗,服務于近百家大型機構與客戶。

在雷鋒網《AI金融評論》與阿里云聯合主辦“銀行系統(tǒng)云化升級”實戰(zhàn)體驗營中,陳威就從阿里云服務金融機構的過往經驗中提取精華,詳盡深入地討論了他們在金融核心系統(tǒng)轉型方面的探索和實踐。

欲獲得所有講者視頻,可關注公眾號“AI金融評論”(ID: aijinrongpinglun),進群獲取回放鏈接。

以下為陳威演講內容,雷鋒網(公眾號:雷鋒網)做了不改變原意的編輯和整理:

今天的主題是《金融核心云原生轉型的探索與實踐》。

在整個金融業(yè),尤其在銀行領域,核心系統(tǒng)是IT整體支出占比最大,最為復雜,對于技術要求最高的一塊。這也是我們認為,整個金融行業(yè)包括銀行,在朝著云化轉型的理念里,最后最難的一部分。

今天的內容首先會講到銀行核心系統(tǒng)云化轉型的訴求,簡單來講就是客戶和我們?yōu)槭裁匆鲞@件事?其次是核心云原生轉型的挑戰(zhàn)與應對。

銀行核心系統(tǒng)云化轉型的訴求

可能在座的聽眾有所了解,金融核心實際上經過了好幾代,存在代際的差異。

最早是傳統(tǒng)綜合業(yè)務系統(tǒng)這部分,然后到第一代基于主機的單體式核心系統(tǒng)。比如錢存在國有大行那里,都是在主機系統(tǒng)Mainframe(大型機)上。

大量的農商農信體系是在AS400上;還有一部分在Power小型機系列。

第二代就是我們通??吹姐y行會走到瘦核心的階段,從原來的核心系統(tǒng)進行拆分,尤其是面向敏態(tài)的部分,通常會建設一個叫互聯網核心的系統(tǒng)。

第一代的技術架構的改造或者升級,通常的做法,基于從單體下移到基于ESB的SOA架構。近幾年有些開發(fā)商會基于開源Spring Cloud把這部分SOA架構升級到微服務的架構。

從技術架構路線來講,這是從ESB向微服務框架的體系改進,這就是我們經常聽到的分布式核心的實際的現狀。

從應用架構路線來看,技術層面雖然有一些升級,但是它底層模型和應用架構,其實沒有太大變化。

第二代核心的典型特征就是以ESB為核心和微服務架構,但有個問題沒有解決:底層對業(yè)務敏捷的支撐是心有余而力不足。支撐一些新的產品,服務或者功能上線需要大量的人力定制化開發(fā),業(yè)務并不夠敏捷。

隨著云計算技術的不斷發(fā)展和成熟,云化的潮流勢不可擋,不論是傳統(tǒng)企業(yè)還是金融系統(tǒng),有意愿和動力升級到云上核心,這就是所謂的第三代,也叫云原生核心,基于容器云原生或者基于PaaS等技術。

它跟我們通常理解的分布式核心,實際上有較大差異。第三代是完全走向IaaS/PaaS化,但在底層應用架構方面,其實也有相應的變更,類似于大家聽到的中臺化、領域設計,這些關鍵字都會在第三代核心中有所體現。

第三代金融核心關鍵性標準

我們試圖總結一下第三代核心的一些關鍵詞,經過長時間的調研與歸納,形成了這么一些標簽,云原生,異地多活,中臺化,數字化。

云原生和異地多活,偏向技術架構和基礎設施;中臺化和數字化,偏向于業(yè)務和應用。

云原生:金融核心實際上也是應用系統(tǒng),本質上和其他業(yè)務系統(tǒng)沒有特別大的差異,但是它比較復雜,對業(yè)務連續(xù)性和一致性的保障會比較高。

同時,它本質上是一個應用,所以云原生應用該具備的特征,它實際上也具備。比如容器化部署模式,PaaS的資源供給應用需要的能力,這都屬于云原生范疇。

異地多活:大部分新建的銀行要做的核心,基本上會有異地多活。它不光是同城容災或者異地容災,是能夠做到多地多活的模式,可以做到城市級的容災。對于傳統(tǒng)金融機構而言,異地多活也是比較大的挑戰(zhàn)。

中臺化:原來的集中式架構,就是傳統(tǒng)一個大的單體化應用,牽一發(fā)而動全身。

當需要定制化或創(chuàng)新金融產品服務,尤其是疫情常態(tài)化之后,未來有很多不見面的流程服務,包括基于互聯網或者視頻的新渠道形態(tài),原來的架構不能復用。

這時希望打造一個堅實的業(yè)務中臺能力,能夠支撐未來多變的挑戰(zhàn)。中臺化最終是為了提高面向創(chuàng)新的效率,這也是建中臺的初心,這是支撐業(yè)務敏捷非常重要的手段。

數字化:能夠以數字化模式,展現里面所有運營相關內容,有了數字化運營的基礎和能力,智能自動化運維才有空間,這是核心未來發(fā)展的重要方向。

其次,因為核心系統(tǒng)的生命周期非常長,可能會要支撐全行的業(yè)務支撐十年八年的的時間。如果遇上比如數字貨幣這種國家大力推行的方向,它對于核心有怎樣的挑戰(zhàn)?所以架構上的設計,一定要把這個(時間跨度)也考量進去,具備很強的擴展能力。

第三代金融核心的重要意義

自主創(chuàng)新:首先它是自主創(chuàng)新的一個標桿。但從我們的觀察來看,2020年是云原生核心的元年,諸多傳統(tǒng)金融機構在逐步的進行嘗試。

行業(yè)標準:在第三代核心,或者全分布式、云原生、多活核心架構領域,還沒有公認的標準。金融機構非常想去打造行業(yè)的先鋒標桿,沉淀的卓越實踐參考。

實施工藝:核心是一個龐大的項目群,周期很長,可能有不同的開發(fā)商,涉及的人員非常多,不可能按照原來的小應用開發(fā)模式,必須要有一套統(tǒng)一規(guī)范的框架和實施工藝,支撐長生命周期的大型系統(tǒng)開發(fā),能夠在上面開發(fā)整個核心系統(tǒng)上百個應用。

能把這三點做好,是我們認為第三代核心在金融機構落地的標志。

第三代金融核心的業(yè)務價值

首先是全棧式的自主可控,滿足相關的要求。

多活架構,可以做到RPO=0,甚至是城市級的容災,RPO=0,有問題的話恢復時間<1分鐘。如果大家對于基礎設施比較了解,就會了解要達到這樣一個指標會有多么巨大的挑戰(zhàn),只有達到城市級別的RPO=0,RTO分鐘級,才能夠真正的保證業(yè)務的連續(xù)性。

彈性擴展,基于分布式架構的擴展性,一定比集中式架構要好,所以它完全能夠滿足業(yè)務的特殊要求或者線性增長,支撐傳統(tǒng)金融機構做類似于雙十一這樣的大促銷,金融爆款產品的秒殺,或者是一些高并發(fā)的場景金融。

業(yè)務敏捷,產品團隊能很快在該框架的核心上,實現新的金融產品和服務。在傳統(tǒng)的集中式架構下,上線新的大一些的功能就可能需要大量改動核心內部、關聯系統(tǒng),造成業(yè)務上架用時較長?;谖⒎栈蚍植际郊軜嫷模梢酝ㄟ^devops模式縮短業(yè)務交付時間。

運維成本,云原生架構基于相對低廉的x86服務器構建,同等處理能力下,分布式架構的單位運行成本大幅降低,分布式架構的年均運行維護成本是大型機的17%。

金融機構們的訴求是什么?

在一個分布式的云化環(huán)境中,要保證核心穩(wěn)定運行,其實有三個非常關鍵的標志。

整體完全自主掌控。

從財務的角度看,最后達到每單筆交易/每個賬戶成本的下降。

業(yè)務穩(wěn)定性、連續(xù)性不降低的前提下,支撐業(yè)務敏捷。

這三點衍生出金融機構對供應商/合作伙伴的訴求,大體分為4個方向。

咨詢與設計:架構咨詢指導,技術,開發(fā)規(guī)范等,配套的組織體系架構等。

服務交付:服務的長期交付過程,一般來講建設周期在2——3年,所以整體的人員投入,開發(fā)實施交付規(guī)范等。

運維保障:后續(xù)的長期運維保障,出問題怎么監(jiān)控、解決,怎么更自動化;

產品與方案:最底層的是產品方案的支撐,包括整體規(guī)劃路線圖,產品的延續(xù)性、一致性、無縫升級維護,還有產品計劃的發(fā)布策略、相應的生態(tài)豐富度。

客戶的訴求可以分為三環(huán),最難解決的是“1環(huán)”問題:

業(yè)務一致性,怎么實現分布式事務?各種各樣的模式,到底用在哪些場景?各種模式的利弊是什么?

數據一致性,尤其是異地多活這種情況下,數據庫怎么保證良好的支撐,尤其在異地之后的數據容災等問題,都是基礎架構部門非常關心的“1環(huán)”內容,通常很難靠金融機構自己解決,一般需要外部供應商來做。

“2環(huán)”重點是怎么領域化建模,有沒有一些最佳實踐?底層模型框架怎么處理?集中化架構到分布式架構,再到云化架構,有沒有一些特殊的差異?

“3環(huán)” 涵蓋整個云化環(huán)境下的運維保障體系,devOps體系,整體的部署架構體系,比如怎么做單元化架構等。

云原生轉型的挑戰(zhàn)和應對

從哪些框架/思路,去解決轉型訴求帶來的挑戰(zhàn)?

可能原來大家理解的,主要是在業(yè)務和數據建模,以及底層的技術軟件支撐。但在大量調研之后,發(fā)現其實中間還缺兩層,就是架構集成、開發(fā)運維部分,這也是要攻克的難點。

之前講到,第一代、第二代(金融核心)里這塊業(yè)務流程不會有太大調整,但在第三代,一定要真正讓它敏捷,對業(yè)務流程清晰梳理,同時要能轉化為類似中臺的模式。

上半部分屬于企業(yè)級架構建模的范疇,下半部分是建模之后怎樣在云上落地。

我們怎么做敏捷的架構設計?

做敏捷的架構設計,首先要考慮中臺化領域設計。

相對傳統(tǒng)的服務集成架構是渠道層+整合層+核心系統(tǒng),但中臺化分層就會拆成渠道層、開放層、產品服務層、中臺能力層、基礎服務層等。

其中,渠道層,包括各個電子化渠道,開放互聯網渠道,線下的渠道等。

像產品服務層,其實不是產品真正執(zhí)行代碼的地方,實際是業(yè)務能力編排的領域。例如存貸款這些業(yè)務,也是經過一個流程編碼,調用不同的引擎賬戶和中臺能力,去支撐完成業(yè)務鏈。

其次是思考云原生應用框架的搭建。

為什么要考慮框架?我們在客戶項目中經常遇到一個客戶的問題,感嘆懂業(yè)務的不懂云原生分布式;懂云原生分布式的,對業(yè)務理解可能也沒有那么深。

現在更先進的底層技術,比如云原生分布式數據庫,學習使用和運維的難度可能比原來要高,這樣會極大影響技術的可獲得性,就是好不好用的問題。

這需要一套框架整合起來,在業(yè)務組件技術層面封裝,降低開發(fā)難度,最后讓普通的應用開發(fā)人員,能夠像普通單體架構一樣開發(fā)業(yè)務應用,而不用關心這后面到底是在什么樣的環(huán)境里部署的。

再就是底層基礎設施部分。

因為開發(fā)周期非常長,難免中間有老的核心系統(tǒng),怎么統(tǒng)一完成服務調度治理,怎么在盡量不改代碼的情況下,更平滑地接入和交互?

其實我們講的mesh技術,就比較好解決這個問題。我們也發(fā)現很多客戶不由自主地運用mesh來支撐集成的架構核心。

使用mesh,下一代的微服務技術,結合分布式網關,能夠跟ESB對接,支撐傳統(tǒng)業(yè)務調用——這也是服務網格目標。這部分與現在經常講到的low code低代碼、低侵入,都具備相近似的模式。

如果想用mesh的模式實現異構架構集成等?這就尤為需要關注云化分布式改造方面的新進展。

以往來講,spring cloud這套體系,如果你要寫一個比較健壯的核心應用,一定要在體系里把所有代碼和編排都放進去,實際上每個真正的業(yè)務代碼量占整體比較少,會有大量業(yè)務無關的邏輯。

這部分如果通過mesh技術,直接用sidecar處理,對于原來的業(yè)務應用不會有大量的侵入。因為走的是網絡層所有監(jiān)控,所以能夠把整個架構的鏈路全部清晰表達出來。這對全方位監(jiān)控也是很重要的內容。

如何保證質量安全與穩(wěn)定性?

客戶無論是大機下移還是云化轉型,都有一個非常重要的前提:保證自身業(yè)務連續(xù)性;保證整體業(yè)務安全情況下,能支撐業(yè)務敏捷。

在質量安全與穩(wěn)定性方面,我們有一整套可回滾可灰度可監(jiān)控的防控體系,分為三層質量網。

未來一旦微服務化、云化,它會有大量的容器應用,不大可能靠人力定位最終的問題,一定要靠自動化、智能化的方式解決傳統(tǒng)的巡檢監(jiān)控問題??偟膩碚f,會有配套機制保障終端客戶不出問題,設施是不可靠的,要從應用、軟件、機制規(guī)范、工具體系支撐。

另外就是異地多活架構。

這部分實際是支付寶能去支持雙十一的底層核心架構,是三地五中心的多活架構。在互聯網上,我們一般采用客戶ID號尾號分片的方式,最后拆到100個單元,能夠在不同機房之間精細調撥流量。

所以任何一個機房或城市出現問題,我們都能把流量瞬間調撥過去,同時業(yè)務應用能承擔起來,機房級或城市級容災都能做到RPO=0。這里面非常核心的,就是底層分布數據庫,真正能夠支持異地容災的分布式結架構。

比如在異地機房,整個單元從端到端升級到一個新的架構,現在可以做到機房級的邏輯單元架構更新,或者應用版本大規(guī)模升級,這些都可以通過單元化方式實現。

無論在哪個級別,RPO都能做到等于0,但由于網絡或者物理限制,無法做到RTO=0。

陳威在本場演講中,還談到了金融核心轉型的實踐路徑和案例分析,并回答了銀行大機下移、數字貨幣對金融核心的挑戰(zhàn)等提問。欲獲得本場演講回放,可關注公眾號“AI金融評論”(ID: aijinrongpinglun),回復關鍵詞“參會”,進群獲取回放鏈接。

本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

立即登錄,閱讀全文
版權說明:
本文內容來自于雷鋒網,本站不擁有所有權,不承擔相關法律責任。文章內容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權,請聯系管理員(zzx@kchuhai.com)刪除!
掃碼登錄
打開掃一掃, 關注公眾號后即可登錄/注冊
加載中
二維碼已失效 請重試
刷新
賬號登錄/注冊
個人VIP
小程序
快出海小程序
公眾號
快出海公眾號
商務合作
商務合作
投稿采訪
投稿采訪
出海管家
出海管家