通過使用AWS,DW實現(xiàn)了全球統(tǒng)一的IT架構(gòu)部署和資源協(xié)作,我們用14人的運維團(tuán)隊就支持了DW集團(tuán)跨越北京、寧夏、新加坡、東京四個城市的IT應(yīng)用。
——王耀東
丹尼爾惠靈頓貿(mào)易(深圳)有限公司CTO
DANIEL WELLINGTON(以下簡稱“DW”)是一個源自瑞典的腕表品牌,以北歐簡約設(shè)計理念,為消費者提供個性化配飾選擇。自2011年成立以來,DANIEL WELLINGTON品牌在全球范圍內(nèi)掀起腕表時尚的新潮流,業(yè)務(wù)發(fā)展迅速。DW與100多個市場的分銷商建立了合作,共有8000多個銷售點。全球分布十四個辦公地點:斯德哥爾摩、烏普薩拉、紐約、洛杉磯、倫敦、科隆、首爾、東京、新加坡、香港、上海、深圳、孟買和迪拜。
應(yīng)用背景
2014年,DW就開始使用Amazon Web Services(AWS),全球的業(yè)務(wù)應(yīng)用全部運行在AWS上,在海外使用了AWS歐洲(愛爾蘭)區(qū)域、美國(俄勒岡)區(qū)域、亞洲(日本)區(qū)域、亞洲(新加坡)區(qū)域。
DW于2015年進(jìn)入中國市場。為了貼近中國消費者,決定選擇由北京光環(huán)新網(wǎng)科技股份有限公司(“光環(huán)新網(wǎng)”)和寧夏西云數(shù)據(jù)科技有限公司(“西云數(shù)據(jù)”)運營的AWS中國區(qū)域,在中國獨立搭建一套IT應(yīng)用。DW中國CTO王耀東表示,“之所以在中國選擇AWS,是因為DW在海外已經(jīng)使用AWS,體驗很好。我們決定把全球統(tǒng)一部署作為我們的第一原則,這樣便于管理和協(xié)作。”
從2016年開始,DW將官方中文網(wǎng)站由歐洲區(qū)域遷移到光環(huán)新網(wǎng)運營的AWS中國(北京)區(qū)域。當(dāng)時,AWS在中國還是以有限預(yù)覽的方式為精選客戶提供服務(wù)。后來,DW相繼啟用由光環(huán)新網(wǎng)運營的AWS中國(北京)區(qū)域和由西云數(shù)據(jù)運營的AWS中國(寧夏)區(qū)域。
DW在AWS上運行的應(yīng)用主要分三大類:一是業(yè)務(wù)系統(tǒng),包括官方網(wǎng)站商城、零售POS系統(tǒng)、微信H5、公眾號程序等;二是后臺系統(tǒng),包括AD域服務(wù)、Microsoft Dynamics NAV ERP、Microsoft Dynamics CRM等;三是系統(tǒng)接口和微服務(wù),主要是各個系統(tǒng)之間、以及系統(tǒng)和外部供應(yīng)商之間的數(shù)據(jù)接口。
取得的成效
DW亞太信息技術(shù)運營經(jīng)理管宇輝表示,使用AWS,讓DW在四個方面獲得益處:
01 按需使用,快速部署
近五年以來,DW的營收規(guī)模高速增長,如果繼續(xù)使用傳統(tǒng)租賃IDC或者自有IDC,DW需要花費大量硬件成本以支持公司的快速擴(kuò)張。使用AWS之后,DW可以隨時啟動新的服務(wù),只需要完成相應(yīng)的預(yù)算審批流程即可,節(jié)省了傳統(tǒng)的年度預(yù)算、硬件采購、備件采購維護(hù)和運維成本。
02 快速彈性擴(kuò)容,支撐瞬時流量爆發(fā)
DW是社交推廣的明星企業(yè),經(jīng)常能夠獲得和流量大咖的合作推廣的機(jī)會。其中最大的一次合作曝光為DW官網(wǎng)網(wǎng)站帶來了超過日常400倍的訪問流量爆增。這在使用傳統(tǒng)租用IDC的公司是無法想象也非常難以處理的。而依靠AWS強(qiáng)大的彈性擴(kuò)容能力,DW得以在1個工作日內(nèi)完成官網(wǎng)的彈性擴(kuò)容調(diào)整,支撐每一次峰值流量到訪。
03 全球化平臺,提高運維效率
AWS全球統(tǒng)一的管理架構(gòu)、統(tǒng)一的API、雙語支持,使得中國和瑞典兩地的運維團(tuán)隊可以利用7個小時的時差,互相運維對方的云平臺,從而大大降低了人力成本,也讓運維團(tuán)隊盡量減少夜班和節(jié)假日加班。借助AWS云、通過全球協(xié)作實現(xiàn)工作與生活的平衡,讓DW運維團(tuán)隊頗為自豪。
每逢電商大促季,在中國,我們熟悉的場景都是全員通宵奮戰(zhàn)。而在DW,就可以晚上只安排少量的運維人員值班,而由另一時區(qū)的運維團(tuán)隊代勞。如果有系統(tǒng)異常,直接進(jìn)入相關(guān)區(qū)域的賬號進(jìn)行第一輪檢查和處理以及緊急修復(fù)操作。若需要,才會聯(lián)系當(dāng)?shù)厝藛T一起進(jìn)行第二輪的問題修復(fù)。這樣的替補機(jī)制,能讓運維人員以正常的作息時間應(yīng)對24小時不停的在線業(yè)務(wù)。
此外,在DW中國的服務(wù)落地過程中,深圳的運維團(tuán)隊利用AWS東京區(qū)域和新加坡區(qū)域為DW中國的業(yè)務(wù)提供支持,將服務(wù)落地時間從1-2個月縮短到了1-2天。
04 責(zé)任共擔(dān),精簡團(tuán)隊
管宇輝帶領(lǐng)的亞太區(qū)運維和支持團(tuán)隊只有14人,卻要管理DW北京、寧夏、新加坡、日本四大區(qū)域的IT應(yīng)用,從架構(gòu)、部署、安全到運維,以一個精簡但專業(yè)的團(tuán)隊支撐了DW中國和亞太兩個大區(qū)的業(yè)務(wù)發(fā)展。
DW使用AWS云服務(wù)非常全面,據(jù)統(tǒng)計超過30多種。
DW所使用的AWS云服務(wù)包括
Amazon Elastic Compute Cloud(Amazon EC2)
Amazon EC2 Container Registry(Amazon ECR)
Amazon EC2 Container Service(Amazon ECS)
AWS Lambda、Elastic Load Balancing(ELB)
Amazon Simple Storage Service(Amazon S3)
Amazon Elastic Block Store(Amazon EBS)
Amazon Glacier、Amazon Aurora
Amazon Relational Database Service(Amazon RDS)
Amazon DynamoDB、Amazon ElastiCache、
Amazon Redshift、AWS CloudTrail、AWS Config
Amazon Virtual Private Cloud(Amazon VPC)
AWS Direct Connect、Amazon CloudWatch
AWS Systems Manager、AWS CloudFormation
AWS Identity and Access Management(IAM)
Amazon Athena、Amazon Elasticsearch Service
Amazon Kinesis Streams、Amazon API Gateway
Amazon Cognito等;
下圖為DW基于AWS云的系統(tǒng)架構(gòu)圖。
圖1:DW基于AWS云的系統(tǒng)架構(gòu)圖
運維自動化
DW使用AWS的一個重要心得,就是運維自動化。管宇輝說,DW盡量不讓運維人員陷入到重復(fù)的運維工作中。
自動化部署
DW有超過90%的基礎(chǔ)架構(gòu)已經(jīng)實現(xiàn)了使用AWS CloudFormation自動化腳本部署。
使用AWS CloudFormation,DW可以為服務(wù)或應(yīng)用程序架構(gòu)創(chuàng)建模板。當(dāng)需要做新的部署或者擴(kuò)容時,只需復(fù)制現(xiàn)有模板,必要時適當(dāng)修改參數(shù),就可以使用這些模板,快速、可靠地配置服務(wù)或應(yīng)用程序。從瑞典團(tuán)隊開始,DW就非常注重IT架構(gòu)的安全可靠與運維自動化。因此,亞太團(tuán)隊開始工作時,也從瑞典團(tuán)隊借鑒了主要的模板和方法。
同時,DW會使用AWS Config服務(wù),評估、審計相關(guān)的AWS資源配置。AWS Config會持續(xù)監(jiān)控和記錄AWS資源配置,判斷相關(guān)的配置是否符合內(nèi)部指南的配置要求。DW也會通過CloudTrail,對AWS賬戶進(jìn)行監(jiān)管、合規(guī)性檢查、操作審核和風(fēng)險審核。
DW還會定期根據(jù)AWS架構(gòu)完善的框架(Well-Architected Framework),對自己的IT架構(gòu)進(jìn)行評估,確定下一步優(yōu)化的方向。例如在一次IT架構(gòu)評估中,DW意識到日志審計應(yīng)該建立單獨的賬戶,這樣能夠更好地控制安全風(fēng)險。
容器化
DW提高運維水平的另一個措施,是使用Amazon ECR、Amazon ECS,將傳統(tǒng)的Amazon EC2架構(gòu)轉(zhuǎn)變成容器化的架構(gòu)。實現(xiàn)容器化以后,DW使用Amazon EC2 Auto Scaling組,實時地檢測每一臺主機(jī)、每一個容器的健康度。如果其健康度有問題,或者某個組件失效,DW會通過自動化的手段重啟相應(yīng)的業(yè)務(wù)程序,實現(xiàn)不下線的平穩(wěn)操作。
通過一系列的措施,DW中國IT團(tuán)隊在2018年7月5日接管中國官網(wǎng)以后,實現(xiàn)了99.98%的可用性,將官網(wǎng)可用性提高了0.05%,并且在全天高峰銷售時段實現(xiàn)了100%可用性記錄,幾乎最大程度地幫助業(yè)務(wù)部門實現(xiàn)業(yè)務(wù)目標(biāo)。
無服務(wù)器架構(gòu)
DW在接口層和定時應(yīng)用中,大量使用AWS Lambda和Amazon API Gateway無服務(wù)器服務(wù)技術(shù)進(jìn)行部署。通過無服務(wù)器架構(gòu),大大提高了DW應(yīng)用系統(tǒng)之間接口的靈活性。例如,DW擁有官方網(wǎng)站、天貓商城、京東、微信小程序等眾多訂單系統(tǒng),都需要向Amazon ERP系統(tǒng)傳輸數(shù)據(jù)。按照以往的做法,每一個訂單系統(tǒng),都要分別寫程序與Amazon ERP系統(tǒng)對接。使用AWS Lambda無服務(wù)器技術(shù),DW在訂單系統(tǒng)和Amazon ERP系統(tǒng)之間僅做一個接口應(yīng)用,就可以實現(xiàn)Amazon ERP系統(tǒng)跟任意訂單系統(tǒng)的對接。
采用無服務(wù)器架構(gòu)實現(xiàn)接口應(yīng)用主要有兩個好處:一是自動實現(xiàn)彈性擴(kuò)容。即使訂單量猛增的情況,DW也不用擔(dān)心訂單系統(tǒng)過度承壓,AWS Lambda會自動實現(xiàn)彈性擴(kuò)容。采用傳統(tǒng)的架構(gòu),在進(jìn)行市場促銷活動之前一定要對訂單系統(tǒng)進(jìn)行壓力測試,如果發(fā)現(xiàn)服務(wù)器有瓶頸,就要提前擴(kuò)容,以免在“雙十一”大促這樣的情況下訂單流出現(xiàn)瓶頸。采用無服務(wù)器架構(gòu),即便每分鐘10萬訂單量,AWS都能輕松處理。
突發(fā)流量對DW這樣的時尚品牌來說是比較常見的,曾有一位時尚博主發(fā)送了一條關(guān)于DW產(chǎn)品的微博,當(dāng)天DW官網(wǎng)的流量就增長了3倍。采用無服務(wù)器架構(gòu),讓DW毫無壓力。
二是接口可以復(fù)用。同一個接口應(yīng)用,只要修改一個接口代碼,就可以對接不同的ERP和不同的訂單系統(tǒng)。例如,可以對接DW在韓國、歐洲和澳洲的Amazon ERP。同時用這一個接口應(yīng)用,可以輕松對接官網(wǎng)、天貓、淘寶和京東。
實際上,DW在中國就有8個電商平臺,如果按以前的模式,需要做8次開發(fā),分別實現(xiàn)8個電商平臺與ERP的對接?,F(xiàn)在,只需要修改接口,跟8個平臺的標(biāo)準(zhǔn)開發(fā)文檔對應(yīng)上,就可以讀取數(shù)據(jù)。而且這個接口應(yīng)用是從瑞典團(tuán)隊復(fù)制過來的。所以,DW中國團(tuán)隊相當(dāng)于只用五分之一的精力,就實現(xiàn)了以前8份工作的效力。
使用多種數(shù)據(jù)庫服務(wù)
DW使用了由光環(huán)新網(wǎng)和西云數(shù)據(jù)提供的AWS全系列的數(shù)據(jù)庫服務(wù)。其中,官網(wǎng)主數(shù)據(jù)庫使用Amazon RDS(MySQL),積分商城主數(shù)據(jù)庫使用Amazon Aurora,大系統(tǒng)之間的緩存使用Amazon ElastiCache,無服務(wù)器架構(gòu)的接口數(shù)據(jù)庫使用Amazon DynamoDB,數(shù)據(jù)倉庫使用Amazon Redshift。
DW對這些托管式數(shù)據(jù)庫服務(wù)很認(rèn)可。管宇輝以Amazon RDS舉例說,托管式服務(wù)讓DW的運維非常省事。以前,運維人員需要關(guān)心數(shù)據(jù)庫版本是否更新,是否有新的問題以及是否需要修復(fù);在設(shè)計數(shù)據(jù)庫架構(gòu)的時候,要考慮跨可用區(qū)或跨區(qū)域的災(zāi)備需求;數(shù)據(jù)備份頻率以及用什么備份存儲等等。不僅要關(guān)注設(shè)計,還需要手動配置。使用Amazon RDS以后,能夠自動實現(xiàn)版本升級,對安全漏洞打補丁,同時會給客戶發(fā)送即時提醒,DW通過這些郵件和信息就掌握全部情況。
Amazon Aurora則在Amazon RDS的基礎(chǔ)上更進(jìn)了一步,自動進(jìn)行三個可用區(qū)的災(zāi)備,讓DW更加放心。Amazon Aurora的高性價比也令管宇輝印象深刻。他做過一個比較,積分商城在西云數(shù)據(jù)運營的AWS中國(寧夏)區(qū)域使用Amazon Aurora,與之前相比,成本進(jìn)一步降低了50%。
DW使用AWS的經(jīng)驗和心得非常多,例如DW在安全與權(quán)限管理、嘗試IoT新服務(wù)推進(jìn)新零售、團(tuán)隊能力培養(yǎng)等方面,都有很多可以借鑒之處。
DW的IT團(tuán)隊作為一個勇于創(chuàng)新、勇于嘗試的團(tuán)隊,遇到AWS如此豐富的云服務(wù)功能,可以說如魚得水,如虎添翼。正如DW中國CTO王耀東所說,“非常高興DW中國選擇了AWS云。同時,由光環(huán)新網(wǎng)和西云數(shù)據(jù)運營的AWS(中國)區(qū)域近兩三年的高速發(fā)展,上線了新的區(qū)域和許多新服務(wù)。DW已經(jīng)啟動了新項目的POC,將繼續(xù)在AWS云上做一些有趣的實驗和探索,進(jìn)一步挖掘IT的潛力,推動業(yè)務(wù)更上一層樓?!?/span>