容災(zāi)切換必備——阿里云全局流量管理介紹

來源:云棲號(hào)
作者:云棲號(hào)
時(shí)間:2020-08-17
6732
全局流量管理(Global Traffic Manager,以下簡(jiǎn)稱 GTM),是阿里云在19年推出的一款產(chǎn)品。DNS 是當(dāng)今互聯(lián)網(wǎng)領(lǐng)域最常見的流量調(diào)度方式, 隨著分布式服務(wù)技術(shù)的發(fā)展,主備部署、異地多活等多節(jié)點(diǎn)架構(gòu)逐步成為主流。

如今人們對(duì)互聯(lián)網(wǎng)服務(wù)的依賴越來越重,提供低延時(shí)高可用的服務(wù)成為越來越多互聯(lián)網(wǎng)服務(wù)廠商的迫切需求。您是否也遇到過以下問題:

1、需要降低網(wǎng)絡(luò)耗時(shí),卻不知道怎么實(shí)現(xiàn)用戶服務(wù)的就近訪問?

2、需要對(duì)服務(wù)進(jìn)行灰度驗(yàn)證,卻不知道如何控制各個(gè)節(jié)點(diǎn)的流量比重,不知道如何資源分配?

3、知道保障服務(wù)的可用性非常重要,卻在遇到故障時(shí),不知道如何快速將流量引流到其他可用節(jié)點(diǎn)?

您需要全局流量管理產(chǎn)品來幫助您排憂解難。

什么是全局流量管理

全局流量管理(Global Traffic Manager,以下簡(jiǎn)稱GTM),是阿里云在19年推出的一款產(chǎn)品。DNS是當(dāng)今互聯(lián)網(wǎng)領(lǐng)域最常見的流量調(diào)度方式,隨著分布式服務(wù)技術(shù)的發(fā)展,主備部署、異地多活等多節(jié)點(diǎn)架構(gòu)逐步成為主流。對(duì)業(yè)務(wù)流量進(jìn)行有效的調(diào)度管理,以達(dá)到服務(wù)低延時(shí)高可用的目的就顯得尤為重要。根據(jù)對(duì)阿里經(jīng)濟(jì)體多年的流量調(diào)度管理經(jīng)驗(yàn),以及在眾多業(yè)務(wù)場(chǎng)景(容災(zāi)切換,大規(guī)模遷站,經(jīng)濟(jì)體上云等)中的實(shí)踐,全局流量管理應(yīng)運(yùn)而生,能夠幫助用戶高效地管理業(yè)務(wù)流量。

GTM原理

GTM本質(zhì)上是通過DNS實(shí)現(xiàn)流量調(diào)度,底層服務(wù)使用的是“云解析DNS”和“云監(jiān)控”兩款產(chǎn)品,集成了DNS的智能解析功能、云監(jiān)控的應(yīng)用服務(wù)監(jiān)控功能,為客戶輸出不同網(wǎng)絡(luò)或地區(qū)用戶訪問實(shí)現(xiàn)就近接入、應(yīng)用服務(wù)運(yùn)行狀態(tài)的健康檢查、故障自動(dòng)切換等能力。

ia_2500000005.png

圖1:GTM原理圖

GTM會(huì)為用戶提供一個(gè)CNAME接入域名(類似CDN的接入域名,用戶需要將自己的業(yè)務(wù)域名CNAME到該接入域名上來使用GTM的功能)并需要用戶配置地址池(Pool)。

一個(gè)地址池,代表一組提供相同應(yīng)用服務(wù),一般是具備相同運(yùn)營(yíng)商或地區(qū)(region)屬性的IP地址或域名地址。

然后通過訪問策略配置,將接入域名和地址池進(jìn)行關(guān)聯(lián),GTM支持按照運(yùn)營(yíng)商或地域維度解析到某個(gè)地址池,地址池中的地址支持負(fù)載均攤和加權(quán)輪詢的策略。

最后通過開啟健康檢查(HealthCheck)來對(duì)地址池中的地址進(jìn)行可用性監(jiān)控。當(dāng)某個(gè)地址不可用時(shí),會(huì)自動(dòng)隔離該地址;當(dāng)GTM認(rèn)為整個(gè)地址池不可用時(shí)會(huì)自動(dòng)切換到備用地址池。

從概念和原理上,GTM容易和負(fù)載均衡(SLB)以及云解析全局負(fù)載均衡(GSLB)混淆。

全局流量管理(GTM)和負(fù)載均衡(SLB)的區(qū)別:

微信圖片_20200817101224.png

GTM功能特性

地址池:

傳統(tǒng)DNS解析到單個(gè)地址,而GTM則引入地址池概念。通過地址池可對(duì)應(yīng)用服務(wù)的IP地址進(jìn)行統(tǒng)一管理。實(shí)現(xiàn)將終端用戶訪問解析到應(yīng)用服務(wù)地址池,既可實(shí)現(xiàn)高負(fù)載情況下的流量均攤,又可實(shí)現(xiàn)自定義流量分配。同時(shí)當(dāng)?shù)刂烦卣w不可用時(shí),可以做備份切換。

訪問策略:

訪問策略旨在解決根據(jù)請(qǐng)求來源和地址池健康情況進(jìn)行地址池切換的問題。既能做到地址池緯度智能解析,又可實(shí)現(xiàn)故障自動(dòng)切換功能。

GTM對(duì)中國(guó)的4大運(yùn)營(yíng)商、7大區(qū)域、海外6大洲進(jìn)行智能DNS解析,可以實(shí)現(xiàn)來源于不同網(wǎng)絡(luò)或區(qū)域的用戶訪問者實(shí)現(xiàn)就近接入,提高訪問速度。

當(dāng)?shù)刂烦卣w出現(xiàn)故障時(shí),GTM會(huì)根據(jù)用戶自定義策略進(jìn)行地址池分鐘級(jí)切換,并當(dāng)?shù)刂烦鼗謴?fù)時(shí)切回。

健康檢查:

依托于云監(jiān)控強(qiáng)大的分布式監(jiān)控功能,GTM新增了HealthCheck模塊,從多個(gè)地區(qū)對(duì)地址池內(nèi)的多個(gè)應(yīng)用服務(wù)IP地址發(fā)起健康探測(cè),目前已支持http/https、tcp、ping三種方式。當(dāng)?shù)刂烦刂械刂钒l(fā)生故障時(shí)HealthCheck模塊會(huì)準(zhǔn)確的檢測(cè)到異常情況并與DNS交互,摘除故障地址。并當(dāng)故障地址恢復(fù)時(shí),自動(dòng)恢復(fù)至解析返回列表。

經(jīng)過測(cè)試團(tuán)隊(duì)對(duì)GTM多次測(cè)試驗(yàn)證,當(dāng)應(yīng)用服務(wù)發(fā)生故障時(shí),GTM能在5分鐘內(nèi)將應(yīng)用服務(wù)的90%左右的流量切換成功。GTM的故障切換生效時(shí)間=故障發(fā)現(xiàn)時(shí)間+DNS切換同步時(shí)間。

故障發(fā)現(xiàn)時(shí)間:目前默認(rèn)的健康檢查配置可以在故障的3分鐘左右準(zhǔn)確發(fā)現(xiàn)故障;

DNS切換同步時(shí)間:目前GTM的cname接入域名TTL設(shè)置為60秒,理論上域名切換后60秒內(nèi)可以生效,但實(shí)際情況取決于全國(guó)各地運(yùn)營(yíng)商的緩存設(shè)置時(shí)間。

應(yīng)用場(chǎng)景

接下來以異地雙活為例介紹如何借助GTM實(shí)現(xiàn)快速容災(zāi)切換。如下圖所示,某服務(wù)的用戶主要分為海外用戶和國(guó)內(nèi)用戶,后端服務(wù)采用一套部署方案。通過GTM對(duì)不同地區(qū)用戶請(qǐng)求進(jìn)行智能調(diào)度,將用戶訪請(qǐng)求流量路由至不同的接入服務(wù)點(diǎn),即海外用戶訪問新加坡中心(Singapore),國(guó)內(nèi)用戶訪問杭州中心(CN-Hangzhou)。當(dāng)某站點(diǎn)發(fā)生故障災(zāi)難時(shí),各接入站點(diǎn)自建互相備份,最終實(shí)現(xiàn)業(yè)務(wù)的高可用。

ia_2500000006.png

圖2:GTM在異地多活中的應(yīng)用

五步快速接入GTM,實(shí)現(xiàn)異地容災(zāi):

(1)全局配置:

基礎(chǔ)配置,主要配置負(fù)載均衡策略、全局TTL、報(bào)警通知組等相關(guān)信息。

(2)地址池配置:

新建地址池Singapore和CN-Hangzhou。每個(gè)地址池中均配置該區(qū)域下多個(gè)服務(wù)IP,以及最小可用地址數(shù)量。當(dāng)?shù)刂烦卮婊畹刂窋?shù)小于該地址池?cái)?shù)量時(shí),則地址池視為不可用。此外,根據(jù)全局配置中負(fù)載均衡策略自動(dòng)實(shí)現(xiàn)流量分配。

(3)開啟健康檢查

即對(duì)地址池中的IP地址配置健康檢查,開啟后可實(shí)現(xiàn)實(shí)時(shí)監(jiān)測(cè)地址的可用性狀態(tài)。根據(jù)地址的可用性進(jìn)行故障自動(dòng)隔離,并通知相應(yīng)報(bào)警組。當(dāng)?shù)刂坊謴?fù)后,自動(dòng)添加至解析列表。此外,當(dāng)?shù)刂烦卣w出現(xiàn)問題時(shí),觸發(fā)默認(rèn)地址池與備用地址池之間自動(dòng)切換。

(4)訪問策略配置

根據(jù)用戶的請(qǐng)求來源設(shè)置最終用戶訪問哪一個(gè)地址池。如圖2所示,海外用戶希望訪問Singapore地址池,則需設(shè)置相應(yīng)訪問策略,請(qǐng)求來源設(shè)置海外地區(qū),默認(rèn)地址池為Singapore,備用地址池設(shè)置CN-Hangzhou。則正常請(qǐng)求下,則海外用戶訪問Singapore中心,發(fā)生故障后會(huì)快速切換至CN-Hangzhou中心。

(5)CNAME接入配置

需要將用戶訪問的主域名CNAME至全局流量管理的實(shí)例域名,才能最終實(shí)現(xiàn)對(duì)應(yīng)用服務(wù)進(jìn)行容災(zāi)、智能接入。即將圖中的www.cloud-example.com CNAME到我們提供的接入域名。

配置完成后,GTM將根據(jù)健康配置實(shí)時(shí)探測(cè)地址池中地址,當(dāng)?shù)刂钒l(fā)生報(bào)警時(shí),則根據(jù)圖3的流程進(jìn)行判斷,實(shí)現(xiàn)容災(zāi)切換,以圖2中IP地址A報(bào)警為例。由此可見,當(dāng)默認(rèn)地址池(Singapore)地址池可用時(shí),則解析列表摘除地址A,當(dāng)默認(rèn)地址池整體不可用時(shí)則切換備用地址池(CN-Hangzhou),切換過程自動(dòng)完成,并縮小時(shí)間至分鐘級(jí)。從而有效保證異地容災(zāi)的切換效率。

ia_2500000007.png

圖3:故障流程切換

原文鏈接:點(diǎn)擊前往 >
版權(quán)說明:本文內(nèi)容來自于云棲號(hào),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
阿里云助力《誅仙世界》端游正式開服!
阿里云助力《誅仙世界》端游正式開服!
近?,完美世界游戲歷時(shí)多年打造的新國(guó)?仙俠MMORPG端游《誅仙世界》在阿?云上正式開服。
阿里云
云服務(wù)
2024-12-29
一文詳解阿里云AI大基建
一文詳解阿里云AI大基建
面向AI時(shí)代,阿里云基礎(chǔ)設(shè)施是如何創(chuàng)新與發(fā)展的?計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)、服務(wù)器、集群、可觀測(cè)等,阿里云全新升級(jí)的AI Infra到底有哪些重磅更新?
阿里云
云服務(wù)
2024-11-02
AI時(shí)代云安全新范式,阿里云安全能力全線升級(jí)!
AI時(shí)代云安全新范式,阿里云安全能力全線升級(jí)!
AI時(shí)代,云安全面臨著新的挑戰(zhàn),不僅要持續(xù)面對(duì)以往的傳統(tǒng)問題,更需要全新理念落地于產(chǎn)品設(shè)計(jì)、技術(shù)演進(jìn)、架構(gòu)設(shè)計(jì),才能實(shí)現(xiàn)效果、性能、和成本的最優(yōu)解。
AI
阿里云
云服務(wù)
2024-09-27
連續(xù)四年!阿里云領(lǐng)跑中國(guó)公有云大數(shù)據(jù)平臺(tái)
連續(xù)四年!阿里云領(lǐng)跑中國(guó)公有云大數(shù)據(jù)平臺(tái)
近日,國(guó)際數(shù)據(jù)公司(IDC)發(fā)布《中國(guó)大數(shù)據(jù)平臺(tái)市場(chǎng)份額,2023:數(shù)智融合時(shí)代的真正到來》報(bào)告——2023年中國(guó)大數(shù)據(jù)平臺(tái)公有云服務(wù)市場(chǎng)規(guī)模達(dá)72.2億元人民幣,其中阿里巴巴市場(chǎng)份額保持領(lǐng)先,占比達(dá)40.2%,連續(xù)四年排名第一。
阿里云
云服務(wù)
2024-09-18
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家