通過(guò)使用AWS,DW實(shí)現(xiàn)了全球統(tǒng)一的IT架構(gòu)部署和資源協(xié)作,我們用14人的運(yùn)維團(tuán)隊(duì)就支持了DW集團(tuán)跨越北京、寧夏、新加坡、東京四個(gè)城市的IT應(yīng)用。
——王耀東
丹尼爾惠靈頓貿(mào)易(深圳)有限公司CTO
DANIEL WELLINGTON(以下簡(jiǎn)稱“DW”)是一個(gè)源自瑞典的腕表品牌,以北歐簡(jiǎn)約設(shè)計(jì)理念,為消費(fèi)者提供個(gè)性化配飾選擇。自2011年成立以來(lái),DANIEL WELLINGTON品牌在全球范圍內(nèi)掀起腕表時(shí)尚的新潮流,業(yè)務(wù)發(fā)展迅速。DW與100多個(gè)市場(chǎng)的分銷(xiāo)商建立了合作,共有8000多個(gè)銷(xiāo)售點(diǎn)。全球分布十四個(gè)辦公地點(diǎn):斯德哥爾摩、烏普薩拉、紐約、洛杉磯、倫敦、科隆、首爾、東京、新加坡、香港、上海、深圳、孟買(mǎi)和迪拜。
應(yīng)用背景
2014年,DW就開(kāi)始使用Amazon Web Services(AWS),全球的業(yè)務(wù)應(yīng)用全部運(yùn)行在AWS上,在海外使用了AWS歐洲(愛(ài)爾蘭)區(qū)域、美國(guó)(俄勒岡)區(qū)域、亞洲(日本)區(qū)域、亞洲(新加坡)區(qū)域。
DW于2015年進(jìn)入中國(guó)市場(chǎng)。為了貼近中國(guó)消費(fèi)者,決定選擇由北京光環(huán)新網(wǎng)科技股份有限公司(“光環(huán)新網(wǎng)”)和寧夏西云數(shù)據(jù)科技有限公司(“西云數(shù)據(jù)”)運(yùn)營(yíng)的AWS中國(guó)區(qū)域,在中國(guó)獨(dú)立搭建一套IT應(yīng)用。DW中國(guó)CTO王耀東表示,“之所以在中國(guó)選擇AWS,是因?yàn)镈W在海外已經(jīng)使用AWS,體驗(yàn)很好。我們決定把全球統(tǒng)一部署作為我們的第一原則,這樣便于管理和協(xié)作。”
從2016年開(kāi)始,DW將官方中文網(wǎng)站由歐洲區(qū)域遷移到光環(huán)新網(wǎng)運(yùn)營(yíng)的AWS中國(guó)(北京)區(qū)域。當(dāng)時(shí),AWS在中國(guó)還是以有限預(yù)覽的方式為精選客戶提供服務(wù)。后來(lái),DW相繼啟用由光環(huán)新網(wǎng)運(yùn)營(yíng)的AWS中國(guó)(北京)區(qū)域和由西云數(shù)據(jù)運(yùn)營(yíng)的AWS中國(guó)(寧夏)區(qū)域。
DW在AWS上運(yùn)行的應(yīng)用主要分三大類(lèi):一是業(yè)務(wù)系統(tǒng),包括官方網(wǎng)站商城、零售POS系統(tǒng)、微信H5、公眾號(hào)程序等;二是后臺(tái)系統(tǒng),包括AD域服務(wù)、Microsoft Dynamics NAV ERP、Microsoft Dynamics CRM等;三是系統(tǒng)接口和微服務(wù),主要是各個(gè)系統(tǒng)之間、以及系統(tǒng)和外部供應(yīng)商之間的數(shù)據(jù)接口。
取得的成效
DW亞太信息技術(shù)運(yùn)營(yíng)經(jīng)理管宇輝表示,使用AWS,讓DW在四個(gè)方面獲得益處:
01 按需使用,快速部署
近五年以來(lái),DW的營(yíng)收規(guī)模高速增長(zhǎng),如果繼續(xù)使用傳統(tǒng)租賃IDC或者自有IDC,DW需要花費(fèi)大量硬件成本以支持公司的快速擴(kuò)張。使用AWS之后,DW可以隨時(shí)啟動(dòng)新的服務(wù),只需要完成相應(yīng)的預(yù)算審批流程即可,節(jié)省了傳統(tǒng)的年度預(yù)算、硬件采購(gòu)、備件采購(gòu)維護(hù)和運(yùn)維成本。
02 快速?gòu)椥詳U(kuò)容,支撐瞬時(shí)流量爆發(fā)
DW是社交推廣的明星企業(yè),經(jīng)常能夠獲得和流量大咖的合作推廣的機(jī)會(huì)。其中最大的一次合作曝光為DW官網(wǎng)網(wǎng)站帶來(lái)了超過(guò)日常400倍的訪問(wèn)流量爆增。這在使用傳統(tǒng)租用IDC的公司是無(wú)法想象也非常難以處理的。而依靠AWS強(qiáng)大的彈性擴(kuò)容能力,DW得以在1個(gè)工作日內(nèi)完成官網(wǎng)的彈性擴(kuò)容調(diào)整,支撐每一次峰值流量到訪。
03 全球化平臺(tái),提高運(yùn)維效率
AWS全球統(tǒng)一的管理架構(gòu)、統(tǒng)一的API、雙語(yǔ)支持,使得中國(guó)和瑞典兩地的運(yùn)維團(tuán)隊(duì)可以利用7個(gè)小時(shí)的時(shí)差,互相運(yùn)維對(duì)方的云平臺(tái),從而大大降低了人力成本,也讓運(yùn)維團(tuán)隊(duì)盡量減少夜班和節(jié)假日加班。借助AWS云、通過(guò)全球協(xié)作實(shí)現(xiàn)工作與生活的平衡,讓DW運(yùn)維團(tuán)隊(duì)頗為自豪。
每逢電商大促季,在中國(guó),我們熟悉的場(chǎng)景都是全員通宵奮戰(zhàn)。而在DW,就可以晚上只安排少量的運(yùn)維人員值班,而由另一時(shí)區(qū)的運(yùn)維團(tuán)隊(duì)代勞。如果有系統(tǒng)異常,直接進(jìn)入相關(guān)區(qū)域的賬號(hào)進(jìn)行第一輪檢查和處理以及緊急修復(fù)操作。若需要,才會(huì)聯(lián)系當(dāng)?shù)厝藛T一起進(jìn)行第二輪的問(wèn)題修復(fù)。這樣的替補(bǔ)機(jī)制,能讓運(yùn)維人員以正常的作息時(shí)間應(yīng)對(duì)24小時(shí)不停的在線業(yè)務(wù)。
此外,在DW中國(guó)的服務(wù)落地過(guò)程中,深圳的運(yùn)維團(tuán)隊(duì)利用AWS東京區(qū)域和新加坡區(qū)域?yàn)镈W中國(guó)的業(yè)務(wù)提供支持,將服務(wù)落地時(shí)間從1-2個(gè)月縮短到了1-2天。
04 責(zé)任共擔(dān),精簡(jiǎn)團(tuán)隊(duì)
管宇輝帶領(lǐng)的亞太區(qū)運(yùn)維和支持團(tuán)隊(duì)只有14人,卻要管理DW北京、寧夏、新加坡、日本四大區(qū)域的IT應(yīng)用,從架構(gòu)、部署、安全到運(yùn)維,以一個(gè)精簡(jiǎn)但專(zhuān)業(yè)的團(tuán)隊(duì)支撐了DW中國(guó)和亞太兩個(gè)大區(qū)的業(yè)務(wù)發(fā)展。
DW使用AWS云服務(wù)非常全面,據(jù)統(tǒng)計(jì)超過(guò)30多種。
DW所使用的AWS云服務(wù)包括
Amazon Elastic Compute Cloud(Amazon EC2)
Amazon EC2 Container Registry(Amazon ECR)
Amazon EC2 Container Service(Amazon ECS)
AWS Lambda、Elastic Load Balancing(ELB)
Amazon Simple Storage Service(Amazon S3)
Amazon Elastic Block Store(Amazon EBS)
Amazon Glacier、Amazon Aurora
Amazon Relational Database Service(Amazon RDS)
Amazon DynamoDB、Amazon ElastiCache、
Amazon Redshift、AWS CloudTrail、AWS Config
Amazon Virtual Private Cloud(Amazon VPC)
AWS Direct Connect、Amazon CloudWatch
AWS Systems Manager、AWS CloudFormation
AWS Identity and Access Management(IAM)
Amazon Athena、Amazon Elasticsearch Service
Amazon Kinesis Streams、Amazon API Gateway
Amazon Cognito等;
下圖為DW基于AWS云的系統(tǒng)架構(gòu)圖。
圖1:DW基于AWS云的系統(tǒng)架構(gòu)圖
運(yùn)維自動(dòng)化
DW使用AWS的一個(gè)重要心得,就是運(yùn)維自動(dòng)化。管宇輝說(shuō),DW盡量不讓運(yùn)維人員陷入到重復(fù)的運(yùn)維工作中。
自動(dòng)化部署
DW有超過(guò)90%的基礎(chǔ)架構(gòu)已經(jīng)實(shí)現(xiàn)了使用AWS CloudFormation自動(dòng)化腳本部署。
使用AWS CloudFormation,DW可以為服務(wù)或應(yīng)用程序架構(gòu)創(chuàng)建模板。當(dāng)需要做新的部署或者擴(kuò)容時(shí),只需復(fù)制現(xiàn)有模板,必要時(shí)適當(dāng)修改參數(shù),就可以使用這些模板,快速、可靠地配置服務(wù)或應(yīng)用程序。從瑞典團(tuán)隊(duì)開(kāi)始,DW就非常注重IT架構(gòu)的安全可靠與運(yùn)維自動(dòng)化。因此,亞太團(tuán)隊(duì)開(kāi)始工作時(shí),也從瑞典團(tuán)隊(duì)借鑒了主要的模板和方法。
同時(shí),DW會(huì)使用AWS Config服務(wù),評(píng)估、審計(jì)相關(guān)的AWS資源配置。AWS Config會(huì)持續(xù)監(jiān)控和記錄AWS資源配置,判斷相關(guān)的配置是否符合內(nèi)部指南的配置要求。DW也會(huì)通過(guò)CloudTrail,對(duì)AWS賬戶進(jìn)行監(jiān)管、合規(guī)性檢查、操作審核和風(fēng)險(xiǎn)審核。
DW還會(huì)定期根據(jù)AWS架構(gòu)完善的框架(Well-Architected Framework),對(duì)自己的IT架構(gòu)進(jìn)行評(píng)估,確定下一步優(yōu)化的方向。例如在一次IT架構(gòu)評(píng)估中,DW意識(shí)到日志審計(jì)應(yīng)該建立單獨(dú)的賬戶,這樣能夠更好地控制安全風(fēng)險(xiǎn)。
容器化
DW提高運(yùn)維水平的另一個(gè)措施,是使用Amazon ECR、Amazon ECS,將傳統(tǒng)的Amazon EC2架構(gòu)轉(zhuǎn)變成容器化的架構(gòu)。實(shí)現(xiàn)容器化以后,DW使用Amazon EC2 Auto Scaling組,實(shí)時(shí)地檢測(cè)每一臺(tái)主機(jī)、每一個(gè)容器的健康度。如果其健康度有問(wèn)題,或者某個(gè)組件失效,DW會(huì)通過(guò)自動(dòng)化的手段重啟相應(yīng)的業(yè)務(wù)程序,實(shí)現(xiàn)不下線的平穩(wěn)操作。
通過(guò)一系列的措施,DW中國(guó)IT團(tuán)隊(duì)在2018年7月5日接管中國(guó)官網(wǎng)以后,實(shí)現(xiàn)了99.98%的可用性,將官網(wǎng)可用性提高了0.05%,并且在全天高峰銷(xiāo)售時(shí)段實(shí)現(xiàn)了100%可用性記錄,幾乎最大程度地幫助業(yè)務(wù)部門(mén)實(shí)現(xiàn)業(yè)務(wù)目標(biāo)。
無(wú)服務(wù)器架構(gòu)
DW在接口層和定時(shí)應(yīng)用中,大量使用AWS Lambda和Amazon API Gateway無(wú)服務(wù)器服務(wù)技術(shù)進(jìn)行部署。通過(guò)無(wú)服務(wù)器架構(gòu),大大提高了DW應(yīng)用系統(tǒng)之間接口的靈活性。例如,DW擁有官方網(wǎng)站、天貓商城、京東、微信小程序等眾多訂單系統(tǒng),都需要向Amazon ERP系統(tǒng)傳輸數(shù)據(jù)。按照以往的做法,每一個(gè)訂單系統(tǒng),都要分別寫(xiě)程序與Amazon ERP系統(tǒng)對(duì)接。使用AWS Lambda無(wú)服務(wù)器技術(shù),DW在訂單系統(tǒng)和Amazon ERP系統(tǒng)之間僅做一個(gè)接口應(yīng)用,就可以實(shí)現(xiàn)Amazon ERP系統(tǒng)跟任意訂單系統(tǒng)的對(duì)接。
采用無(wú)服務(wù)器架構(gòu)實(shí)現(xiàn)接口應(yīng)用主要有兩個(gè)好處:一是自動(dòng)實(shí)現(xiàn)彈性擴(kuò)容。即使訂單量猛增的情況,DW也不用擔(dān)心訂單系統(tǒng)過(guò)度承壓,AWS Lambda會(huì)自動(dòng)實(shí)現(xiàn)彈性擴(kuò)容。采用傳統(tǒng)的架構(gòu),在進(jìn)行市場(chǎng)促銷(xiāo)活動(dòng)之前一定要對(duì)訂單系統(tǒng)進(jìn)行壓力測(cè)試,如果發(fā)現(xiàn)服務(wù)器有瓶頸,就要提前擴(kuò)容,以免在“雙十一”大促這樣的情況下訂單流出現(xiàn)瓶頸。采用無(wú)服務(wù)器架構(gòu),即便每分鐘10萬(wàn)訂單量,AWS都能輕松處理。
突發(fā)流量對(duì)DW這樣的時(shí)尚品牌來(lái)說(shuō)是比較常見(jiàn)的,曾有一位時(shí)尚博主發(fā)送了一條關(guān)于DW產(chǎn)品的微博,當(dāng)天DW官網(wǎng)的流量就增長(zhǎng)了3倍。采用無(wú)服務(wù)器架構(gòu),讓DW毫無(wú)壓力。
二是接口可以復(fù)用。同一個(gè)接口應(yīng)用,只要修改一個(gè)接口代碼,就可以對(duì)接不同的ERP和不同的訂單系統(tǒng)。例如,可以對(duì)接DW在韓國(guó)、歐洲和澳洲的Amazon ERP。同時(shí)用這一個(gè)接口應(yīng)用,可以輕松對(duì)接官網(wǎng)、天貓、淘寶和京東。
實(shí)際上,DW在中國(guó)就有8個(gè)電商平臺(tái),如果按以前的模式,需要做8次開(kāi)發(fā),分別實(shí)現(xiàn)8個(gè)電商平臺(tái)與ERP的對(duì)接?,F(xiàn)在,只需要修改接口,跟8個(gè)平臺(tái)的標(biāo)準(zhǔn)開(kāi)發(fā)文檔對(duì)應(yīng)上,就可以讀取數(shù)據(jù)。而且這個(gè)接口應(yīng)用是從瑞典團(tuán)隊(duì)復(fù)制過(guò)來(lái)的。所以,DW中國(guó)團(tuán)隊(duì)相當(dāng)于只用五分之一的精力,就實(shí)現(xiàn)了以前8份工作的效力。
使用多種數(shù)據(jù)庫(kù)服務(wù)
DW使用了由光環(huán)新網(wǎng)和西云數(shù)據(jù)提供的AWS全系列的數(shù)據(jù)庫(kù)服務(wù)。其中,官網(wǎng)主數(shù)據(jù)庫(kù)使用Amazon RDS(MySQL),積分商城主數(shù)據(jù)庫(kù)使用Amazon Aurora,大系統(tǒng)之間的緩存使用Amazon ElastiCache,無(wú)服務(wù)器架構(gòu)的接口數(shù)據(jù)庫(kù)使用Amazon DynamoDB,數(shù)據(jù)倉(cāng)庫(kù)使用Amazon Redshift。
DW對(duì)這些托管式數(shù)據(jù)庫(kù)服務(wù)很認(rèn)可。管宇輝以Amazon RDS舉例說(shuō),托管式服務(wù)讓DW的運(yùn)維非常省事。以前,運(yùn)維人員需要關(guān)心數(shù)據(jù)庫(kù)版本是否更新,是否有新的問(wèn)題以及是否需要修復(fù);在設(shè)計(jì)數(shù)據(jù)庫(kù)架構(gòu)的時(shí)候,要考慮跨可用區(qū)或跨區(qū)域的災(zāi)備需求;數(shù)據(jù)備份頻率以及用什么備份存儲(chǔ)等等。不僅要關(guān)注設(shè)計(jì),還需要手動(dòng)配置。使用Amazon RDS以后,能夠自動(dòng)實(shí)現(xiàn)版本升級(jí),對(duì)安全漏洞打補(bǔ)丁,同時(shí)會(huì)給客戶發(fā)送即時(shí)提醒,DW通過(guò)這些郵件和信息就掌握全部情況。
Amazon Aurora則在Amazon RDS的基礎(chǔ)上更進(jìn)了一步,自動(dòng)進(jìn)行三個(gè)可用區(qū)的災(zāi)備,讓DW更加放心。Amazon Aurora的高性價(jià)比也令管宇輝印象深刻。他做過(guò)一個(gè)比較,積分商城在西云數(shù)據(jù)運(yùn)營(yíng)的AWS中國(guó)(寧夏)區(qū)域使用Amazon Aurora,與之前相比,成本進(jìn)一步降低了50%。
DW使用AWS的經(jīng)驗(yàn)和心得非常多,例如DW在安全與權(quán)限管理、嘗試IoT新服務(wù)推進(jìn)新零售、團(tuán)隊(duì)能力培養(yǎng)等方面,都有很多可以借鑒之處。
DW的IT團(tuán)隊(duì)作為一個(gè)勇于創(chuàng)新、勇于嘗試的團(tuán)隊(duì),遇到AWS如此豐富的云服務(wù)功能,可以說(shuō)如魚(yú)得水,如虎添翼。正如DW中國(guó)CTO王耀東所說(shuō),“非常高興DW中國(guó)選擇了AWS云。同時(shí),由光環(huán)新網(wǎng)和西云數(shù)據(jù)運(yùn)營(yíng)的AWS(中國(guó))區(qū)域近兩三年的高速發(fā)展,上線了新的區(qū)域和許多新服務(wù)。DW已經(jīng)啟動(dòng)了新項(xiàng)目的POC,將繼續(xù)在AWS云上做一些有趣的實(shí)驗(yàn)和探索,進(jìn)一步挖掘IT的潛力,推動(dòng)業(yè)務(wù)更上一層樓。”