2009年,首屆雙11每秒交易訂單創(chuàng)建峰值400;2021年,雙11每秒交易訂單創(chuàng)建峰值58.3萬,12年交易數(shù)字量猛增的背后,是阿里云在龐大分布式系統(tǒng)上計算和IO能力的飛躍,更離不開阿里云基礎(chǔ)設(shè)施底層網(wǎng)絡(luò)技術(shù)的支撐。在這個萬物智聯(lián)的時代,無論是在線網(wǎng)絡(luò)購物,還是網(wǎng)絡(luò)強國、數(shù)字中國建設(shè),都離不開一張“看不見的網(wǎng)”——基礎(chǔ)設(shè)施網(wǎng)絡(luò)。
作為阿里云基礎(chǔ)設(shè)施的重要組成部分,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團隊負(fù)責(zé)整個阿里云全球基礎(chǔ)設(shè)施網(wǎng)絡(luò),包括大規(guī)模高性能數(shù)據(jù)中心網(wǎng)絡(luò),全球數(shù)據(jù)中心互聯(lián)網(wǎng)絡(luò),邊緣網(wǎng)絡(luò),運營商接入網(wǎng)絡(luò),光網(wǎng)絡(luò),DNS以及創(chuàng)新研究工作。在業(yè)務(wù)支撐上,覆蓋全球云計算以及基于云計算的電商、支付、物流、本地生活等服務(wù)。不但擁有業(yè)內(nèi)領(lǐng)先的超大規(guī)模網(wǎng)絡(luò)智能化運營能力,同時在諸多網(wǎng)絡(luò)技術(shù)領(lǐng)域?qū)崿F(xiàn)創(chuàng)新突破,是行業(yè)生態(tài)中有國際影響力、引領(lǐng)網(wǎng)絡(luò)技術(shù)變革的一支重要力量。 1 Network 智能化網(wǎng)絡(luò)運營 構(gòu)筑高效穩(wěn)定云計算底座 面對網(wǎng)絡(luò)規(guī)模持續(xù)數(shù)量級增長,過去五年,基礎(chǔ)設(shè)施網(wǎng)絡(luò)團隊不斷推動自主技術(shù)創(chuàng)新,打造了一個全智能化的AIOps運營體系,涵括自主研發(fā)的網(wǎng)絡(luò)設(shè)備、軟件、數(shù)據(jù)及算法,從網(wǎng)絡(luò)規(guī)劃到建設(shè)交付,從運維管理到更新?lián)Q代的全網(wǎng)絡(luò)生命周期自動化能力,為阿里云覆蓋全球的百萬級服務(wù)器規(guī)模的云計算提供全球服務(wù)支撐,既提高了運營效率,又有效實現(xiàn)了網(wǎng)絡(luò)故障率的指數(shù)級下降。 在智能系統(tǒng)平臺基礎(chǔ)上,基礎(chǔ)設(shè)施網(wǎng)絡(luò)團隊還建設(shè)了全球大規(guī)模“意圖驅(qū)動網(wǎng)絡(luò)”管控體系,設(shè)計研發(fā)了高級抽象語言、編譯器、形式化驗證、高精度仿真等先進(jìn)技術(shù),其中多項研究成果在網(wǎng)絡(luò)全球頂級會議ACM SIGCOMM論文中屢次發(fā)布。 2 Network 超大規(guī)模高性能 打造新型數(shù)據(jù)中心網(wǎng)絡(luò) 作為大型分布式系統(tǒng)內(nèi)部的高速公路,今天數(shù)據(jù)中心網(wǎng)絡(luò)承載著越來越多計算和存儲系統(tǒng)IO延伸的作用。阿里云新型數(shù)據(jù)中心網(wǎng)絡(luò)是基于阿里云自研交換機構(gòu)建的超大規(guī)模網(wǎng)絡(luò)系統(tǒng),scale out多平面架構(gòu)設(shè)計充分滿足了云計算分布式大規(guī)模系統(tǒng)的算力互聯(lián)以及資源彈性擴展需求,單網(wǎng)絡(luò)集群支持可實現(xiàn)從幾百臺到10 萬臺以上服務(wù)器連接的彈性擴展能力。 在此基礎(chǔ)上,基于Sonic開源社區(qū)的阿里云自研網(wǎng)絡(luò)操作系統(tǒng)(AliNOS)有效打通了單設(shè)備與整網(wǎng)維度的監(jiān)管控能力,在快速迭代新功能的同時實現(xiàn)了監(jiān)管控一體化,全自研的硬件設(shè)備和光互聯(lián)組件完全契合阿里場景進(jìn)行模塊化設(shè)計,實現(xiàn)了成本、供應(yīng)、運維能力的多維度自主控制。 作為業(yè)內(nèi)最受歡迎的高性能網(wǎng)絡(luò)技術(shù),2016年,阿里巴巴開始投入專項研究RDMA(Remote Direct Memory Access),以改造RDMA、提高傳輸性能,目前已建成全球最大規(guī)模數(shù)據(jù)中心內(nèi)的“高速網(wǎng)”,將時延顯著降低90%,支撐了高性能存儲、AI計算等阿里云業(yè)務(wù)和阿里巴巴集團內(nèi)部業(yè)務(wù),取得了巨大的商業(yè)價值。 同時,通過大規(guī)模RDMA網(wǎng)絡(luò)部署實踐,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團隊自主研發(fā)了基于端網(wǎng)協(xié)同的Solar-RDMA高性能網(wǎng)絡(luò)協(xié)議和HPCC流控算法,并通過自研網(wǎng)卡實現(xiàn)了協(xié)議硬件卸載,極大的降低了端到端網(wǎng)絡(luò)延時,提升了網(wǎng)絡(luò)IO吞吐能力,并有效規(guī)避和弱化了網(wǎng)絡(luò)故障、網(wǎng)絡(luò)黑洞等傳統(tǒng)網(wǎng)絡(luò)異常給上層應(yīng)用帶來的性能損失。 3 Network 云邊一體全網(wǎng)調(diào)度 實現(xiàn)網(wǎng)絡(luò)質(zhì)量可預(yù)期 阿里云全球網(wǎng)絡(luò)流量調(diào)度系統(tǒng)NetO采用中心控制與分布式處理有機結(jié)合,提供從中心到邊緣的全網(wǎng)流量調(diào)度能力,為業(yè)務(wù)提供了差異化和高品質(zhì)的網(wǎng)絡(luò)服務(wù)。通過采用行業(yè)最新的Segment Routing技術(shù),結(jié)合Anycast、BGP路由管理,全球網(wǎng)絡(luò)質(zhì)量探測,以及各種場景優(yōu)化算法等真正實現(xiàn)了云邊一體的全球網(wǎng)絡(luò)調(diào)度能力。 同時,阿里云NetO流量調(diào)度系統(tǒng)將精細(xì)化調(diào)度能力、網(wǎng)絡(luò)流量狀態(tài)分析能力以端網(wǎng)融合調(diào)度的方式提供給業(yè)務(wù),實現(xiàn)了符合業(yè)務(wù)特色需求的各種差異化網(wǎng)絡(luò)服務(wù)能力。 隨著泛邊緣分布式云的發(fā)展,云邊一體的網(wǎng)絡(luò)全域調(diào)度無論是從規(guī)模和靈活性角度都將面臨新的挑戰(zhàn),阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團隊在SRv6、自研路由控制協(xié)議,以及調(diào)度模型算法等方面持續(xù)投入和創(chuàng)新,以更靈活多變的控制應(yīng)對邊緣云發(fā)展下的復(fù)雜流量管控,為業(yè)務(wù)提供質(zhì)量可預(yù)期的服務(wù)。 4 Network 開放光網(wǎng)絡(luò) 高速光互連 高速、靈活、開放、協(xié)同發(fā)展已成為光網(wǎng)絡(luò)領(lǐng)域重要技術(shù)發(fā)展趨勢。在光網(wǎng)絡(luò)技術(shù)領(lǐng)域,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團隊在業(yè)界率先開始開放解耦DCI技術(shù)的研發(fā)并實現(xiàn)規(guī)模部署,在光網(wǎng)絡(luò)模型、光網(wǎng)絡(luò)軟件和數(shù)字化、光網(wǎng)絡(luò)自動化、開放解耦ROADM網(wǎng)絡(luò)方面做出多項創(chuàng)新性成果。在光互連技術(shù)方面,從光模塊、光電芯片、超百萬級光模塊數(shù)字智能化運營等方面成果斐然。同時,積極和行業(yè)、高校間進(jìn)行高質(zhì)量合作,對高速光互連、光交換技術(shù)及智能光網(wǎng)絡(luò)等領(lǐng)域的前沿技術(shù)進(jìn)行探索,致力于推動產(chǎn)業(yè)實踐和學(xué)界理論的雙向發(fā)展。 過去三年,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團隊在光通信頂級學(xué)術(shù)會議如OFC、ECOC上發(fā)表學(xué)術(shù)論文16篇,在光通信頂級學(xué)術(shù)刊物(IEEE、OSA和Nature學(xué)術(shù)刊物)上發(fā)表學(xué)術(shù)論文10篇,用數(shù)字書寫著對行業(yè)挑戰(zhàn)性、前瞻性課題的不懈研究。 推薦閱讀 推動光通信創(chuàng)新實踐合力 阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團隊閃耀OFC2021 5 Network 日解析量超萬億DNS 參與網(wǎng)絡(luò)強國基礎(chǔ)設(shè)施 DNS(Domain Name System)是互聯(lián)網(wǎng)訪問的第一跳,是全球互聯(lián)互通關(guān)鍵網(wǎng)絡(luò)基礎(chǔ)設(shè)施,也是云服務(wù)的訪問入口。隨著移動APP、智能終端/IoT、家庭/企業(yè)網(wǎng)絡(luò)接入對DNS安全、穩(wěn)定和智能調(diào)度提出新的需求,阿里云DNS面向云上云下多樣化的連接場景幫助企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型,面向各種終端用戶提供基礎(chǔ)解析服務(wù),目前平臺日均解析服務(wù)量突破萬億。 2017年,阿里云DNS入選工信部評選的“2017網(wǎng)絡(luò)安全試點示范項目”;2020年3月,阿里云云解析DNS作為支撐疫情防控和復(fù)工復(fù)產(chǎn)的網(wǎng)絡(luò)安全公共服務(wù)平臺被工信部重點推薦。目前,阿里云DNS是國內(nèi)首家提供DNSSEC、IPv6、DoH/DoT等功能特性的DNS服務(wù)商。2021年6月,由下一代互聯(lián)網(wǎng)國家工程中心發(fā)布的公共DNS測試結(jié)果表明,阿里云滿足IPv6雙棧環(huán)境的各項功能,且在DNS響應(yīng)延遲這項指標(biāo)上全國領(lǐng)先。 6 Network 業(yè)務(wù)驅(qū)動創(chuàng)新 引領(lǐng)生態(tài)行業(yè)發(fā)展 快速發(fā)展的業(yè)務(wù)驅(qū)動技術(shù)不斷創(chuàng)新。過去幾年,阿里云基礎(chǔ)設(shè)施網(wǎng)絡(luò)團隊始終堅持軟硬一體優(yōu)化、自主可控的研發(fā)創(chuàng)新道路。在技術(shù)商業(yè)化上,阿里云自主研發(fā)的交換機、光網(wǎng)絡(luò)等設(shè)備已大規(guī)模部署并取得業(yè)務(wù)價值。在大規(guī)模部署實踐基礎(chǔ)上,同時積極回饋開源生態(tài)社區(qū),在SONiC社區(qū)、ODCC社區(qū)建設(shè)中做出了積極貢獻(xiàn),領(lǐng)導(dǎo)了S3IP白盒化標(biāo)準(zhǔn)、SRv6等項目的發(fā)展。 2021年7月16日,阿里云基礎(chǔ)網(wǎng)絡(luò)團隊聯(lián)合騰訊,百度等組織發(fā)起了S3IP首屆行業(yè)發(fā)布會,京東、快手等眾多互聯(lián)網(wǎng)行業(yè)伙伴加入,這項旨在標(biāo)準(zhǔn)化白盒網(wǎng)絡(luò)設(shè)備軟硬件設(shè)計,解決用戶痛點的發(fā)布會共吸引了20萬人次參與在線討論,會后,眾多白盒用戶和廠商紛紛郵件申請加入S3IP。