9月16日,Distributed Cloud|2021全球分布式云大會·上海站隆重召開。騰訊云副總經(jīng)理李叢在上午召開的分布式云主題報告會上發(fā)表了題為《CDN分布式架構(gòu)演進》的精彩演講。
調(diào)度是分布式架構(gòu)的核心問題
無論CDN、邊緣云或分布式云,最核心的問題都是如何做好調(diào)度。李叢介紹了騰訊內(nèi)部的調(diào)度技術(shù),一類是流量型的調(diào)度,另一類是資源編排的調(diào)度。調(diào)度問題,映射到實際的CDN場景,核心訴求是如何找到最快路徑。而編排技術(shù),是將各種網(wǎng)絡(luò)服務(wù)單元進行有序的安排和組織,使網(wǎng)絡(luò)各個組成部分平衡協(xié)調(diào);映射到CDN里,就是在解耦的情況下,為業(yè)務(wù)場景找到一個合適的節(jié)點,對它的帶寬、算力、存儲分配合適的空間。
面對如此多的需求,如何從全球數(shù)千個分布式節(jié)點找到匹配方案,使資源利用率最大程度的提升?這是騰訊云CDN投入大量精力并持續(xù)優(yōu)化的事情。
流量調(diào)度解決最核心的問題就是如何讓速度最快。但物理的最近距離并不代表網(wǎng)絡(luò)距離,用戶需要的不是距離最近的機房,而是訪問最快的機房,如何準確為用戶匹配到最快的機房是另一個重要問題。
為解決這兩個問題,騰訊云會綜合全球資源訪問情況,給到用戶訪問最快的節(jié)點。在這個策略,在內(nèi)部實踐中,初期就實現(xiàn)了10%的提升。
針對不同網(wǎng)絡(luò)情況,尋找最佳的傳輸配置策略是網(wǎng)絡(luò)傳輸協(xié)議優(yōu)化的本質(zhì)
李叢提到第二個核心技術(shù)是分布式網(wǎng)絡(luò)技術(shù)。無論任何運營,如果要構(gòu)建在邊緣,網(wǎng)絡(luò)技術(shù)就非常關(guān)鍵,所有的算力資源如何互聯(lián)互通,如何提供整體能力使算力能夠串聯(lián)在一起,都是需要解決的問題。
而在這一方面,騰訊云擁有非常多的技術(shù)優(yōu)化點,比如,動態(tài)路由方面,騰訊云系統(tǒng)每年優(yōu)化2000多萬的鏈路信息,以提供最優(yōu)的路由選擇;另外,傳輸協(xié)議上,騰訊云內(nèi)部分為“內(nèi)功”和“外功”,去探索傳輸?shù)谋举|(zhì),在各種網(wǎng)絡(luò)環(huán)境下根據(jù)業(yè)務(wù)、網(wǎng)絡(luò)傳輸情況,找到最合適的策略;除此之外,依賴于全球基礎(chǔ)設(shè)施節(jié)點以及這些設(shè)施間的互聯(lián),騰訊云還擁有業(yè)務(wù)上的QOS等的優(yōu)化場景。
李叢在眾多場景中挑選“內(nèi)功”的部分技術(shù)進行了詳細講解。
在傳輸協(xié)議方面,最為本質(zhì)的就是如何為一個業(yè)務(wù)匹配到最需要的傳輸鏈路需求。其中幾個比較核心的問題是:
第一,網(wǎng)絡(luò)的環(huán)境紛繁復雜,無法進行有效預(yù)測。李叢舉例說,不同的接入網(wǎng)類型,WIFI、4G網(wǎng)絡(luò),鏈路層不一樣,挑戰(zhàn)點也不一樣。在不同的場景下,通過樣本訓練可以發(fā)現(xiàn),在不同的接入網(wǎng),最優(yōu)參數(shù)的分布方式也不一樣。
第二,運營商不同的限速策略對協(xié)議上的傳輸也有影響,如令牌的限速策略。從服務(wù)端看,丟包的信號特別明顯,如果是漏斗型,丟包不明顯但延遲很明顯。
除了上述兩個特征之外,還會有非常多的特征,無法預(yù)知到底會有多少情況。除了網(wǎng)絡(luò)特征之外,客戶也是一大影響因素,因為每個客戶心中的質(zhì)量標準并不相同。
在標準不一的情況下,怎么做加速算法?為了解決這些問題,騰訊云推出了“千人千面”的方案,為每個“人”配備最適合的策略,給“他”想要的。
李叢介紹說,根據(jù)騰訊云的實踐,“千人千面”方案,在4G網(wǎng)絡(luò)下能夠獲得6-10%的提升。
增強防護能力是面對未來挑戰(zhàn)的關(guān)鍵
第三個關(guān)鍵點是安全問題。很多CDN節(jié)點會受到大量攻擊騷擾,所以在多年前,騰訊云在邊緣做了安全防御策略方案,其中最簡單的核心思路就是分而治之,騰訊云在邊緣上把流量全部打散,達到了更好的防御效果。
提升競爭力,服務(wù)全球——騰訊云CDN
目前騰訊云CDN比較常態(tài)的穩(wěn)定的帶寬在160T以上,最近的峰值即將突破200個T。目前騰訊云CDN包含國內(nèi)的CDN和海外CDN,以及全站加速、快直播、安全CDN等產(chǎn)品。
騰訊云海外CDN也已初具規(guī)模,在亞洲地區(qū)具備了相當?shù)母偁幜?,下半年騰訊云會繼續(xù)投入到中東以及拉美區(qū)域的完善中去。
關(guān)于全站加速,主要是解決四層七層的加速場景,針對不同場景有10-30%的提升,近半年的POC測試來看,騰訊云ECDN的加速性能是非常優(yōu)異的??熘辈サ漠a(chǎn)品,是首個超低延遲的視頻類產(chǎn)品,延時從5秒下降到500ms,卡頓下降30%。
面向未來,下一代CDN架構(gòu)——分布式的操作系統(tǒng)
今年是CDN發(fā)展的第20個年頭,回顧整個CDN的發(fā)展史,對于“下一代的CDN”是什么?李叢發(fā)表了他的看法。
李叢認為,CDN的進化,其實是一個典型的邊緣應(yīng)用需求。在未來5G時代下,無論是VR物聯(lián)網(wǎng)還是無人駕駛,無論是計算還是存儲,對邊緣要求越來越多。在過去的20年,我們可能完成了帶寬從中心到邊緣的遷移,未來10-20年,我們要完成的可能就是計算、存儲從中心到邊緣的遷移任務(wù)。
未來,CDN技術(shù)的開發(fā)能夠像開發(fā)“單機應(yīng)用”一樣簡單。以單機應(yīng)用這樣簡單的方式去構(gòu)建一個分布式的邊緣應(yīng)用。但這將面臨兩個挑戰(zhàn):
第一,分布式算力不是在一臺機器上,它的算力遍布全球各地,有什么方法可以替代這上面的操作系統(tǒng)?第二,在分布式應(yīng)用上如何構(gòu)建那么多的開發(fā)庫?
基于上述思考,李叢認為,未來的架構(gòu)應(yīng)該是分布式的操作系統(tǒng),而這個操作系統(tǒng)有兩大核心特征,一是預(yù)裝能力;二是開放能力。
預(yù)裝能力,用云原生的能力構(gòu)建底層操作能力,并預(yù)裝一些能力,如調(diào)度能力、網(wǎng)絡(luò)加速能力、安全能力、轉(zhuǎn)碼媒體服務(wù)渲染能力等,騰訊云已經(jīng)在很多成熟的產(chǎn)品上開始集成這些能力。作為預(yù)裝的基礎(chǔ)庫,在上層構(gòu)建出開發(fā)引擎,提供類似單機一樣好用的IDE的界面給開發(fā)者,開發(fā)者就可以在上面構(gòu)建出他們需要的應(yīng)用。
開放能力,未來開發(fā)者有能力在操作系統(tǒng)上開發(fā)自己的APP,開發(fā)自己的服務(wù)庫,這些開發(fā)出的服務(wù)庫也可以為他人所用,來實現(xiàn)開放的效果,使得大家一起去共建整個分布式邊緣的能力。
基于上述猜想,李叢預(yù)期了一個CDN發(fā)展的理想狀態(tài):
第一,技術(shù)融合,無論是云上的技術(shù)還是邊緣、虛擬化、分布式存儲、調(diào)度、緩存、網(wǎng)絡(luò)傳輸、運行時、微服務(wù)、中間件等技術(shù),都會融合。
第二,產(chǎn)品聯(lián)動更加緊密,把最大的靈活性給用戶和開發(fā)者。
第三,生態(tài)開放,基于統(tǒng)一的標準和開放的生態(tài),達到人人都是構(gòu)建者的目標。
最后,李叢總結(jié)表示,騰訊云基于對過去技術(shù)的總結(jié)和對未來技術(shù)的暢想和探索,形成了一套次世代的CDN系統(tǒng),目前這套系統(tǒng)在內(nèi)部的場景上已經(jīng)進行了適配使用,在不久的將來隨著市場成熟,騰訊云將對外進行產(chǎn)品化建設(shè),將新一代的CDN提供給用戶使用。