騰訊云:不停服!百T數(shù)據(jù)跨云遷移之戰(zhàn)

來源: 騰訊云
作者:騰訊云
時間:2021-06-04
17278
「銷售易」從創(chuàng)立開始,就選擇了云原生的技術(shù)路徑,以實現(xiàn)更加便利的調(diào)動、更快速的擴容以及更靈活的業(yè)務(wù)部署。

電腦屏幕上進度條再一次慢下來的時候,「銷售易」運維負責人趙文華的表情嚴肅了起來。

連續(xù)熬了幾夜,同事們臉上疲態(tài)盡顯,可是眼前的數(shù)據(jù)同步工作卻沒有想象中順利。

「傳輸?shù)乃俣炔惶€(wěn)定,變慢了」,坐在電腦前面的同事說到。沒有人搭話,機箱和空調(diào)發(fā)出的轟隆聲占據(jù)了全部的空間。

能做的只有等待。

這是國內(nèi)企業(yè)級CRM(客戶關(guān)系管理應用)廠商「銷售易」正在進行的跨云數(shù)據(jù)遷移現(xiàn)場,團隊正在將過去九年的主體業(yè)務(wù)遷移到騰訊云上。

一個謀劃籌備兩年的決定

「銷售易」從創(chuàng)立開始,就選擇了云原生的技術(shù)路徑,以實現(xiàn)更加便利的調(diào)動、更快速的擴容以及更靈活的業(yè)務(wù)部署。

「上云」的選擇是堅定的,也是一個長期的技術(shù)方向。

對于SaaS企業(yè)來說,底層技術(shù)的合作伙伴選擇遵從「穩(wěn)定為王」原則,不太會考慮更換技術(shù)合作伙伴,除了性價比外,更換和遷移隨之而來的系統(tǒng)穩(wěn)定性、業(yè)務(wù)適應性風險是首要評估標準,決策非常謹慎。

重新選擇云服務(wù)合作伙伴,并將數(shù)據(jù)進行遷移的想法,「銷售易」是兩年前開始醞釀的。

2019年,「銷售易」發(fā)布了「客戶數(shù)字化平臺」,還聯(lián)合「企業(yè)微信」發(fā)布汽車、教育、家裝家居三大行業(yè)解決方案。業(yè)務(wù)發(fā)展越來越多樣化,客戶覆蓋領(lǐng)域和數(shù)據(jù)都在快速增加,「銷售易」對云計算資源的需求也呈現(xiàn)了井噴式的增長。

「我們接觸了不少云廠商,進行測試后發(fā)現(xiàn),從故障率、性能、服務(wù)和技術(shù)支持方式上,騰訊云都展示出了優(yōu)異的表現(xiàn)」,趙文華說,「同時,我們是騰訊的SaaS生態(tài)合作伙伴,雙方在業(yè)務(wù)上有深度的合作」。

一個大挑戰(zhàn):數(shù)百TB數(shù)據(jù)不停服遷移

在過去9年多的時間里,「銷售易」在原有云廠商已經(jīng)累積了高達數(shù)百TB的文件數(shù)據(jù)和幾十TB的數(shù)據(jù)庫數(shù)據(jù)(1TB=1024GB)。

經(jīng)過前期的調(diào)研和排查,擺在項目組前面的難題有幾個:

首先,「銷售易」數(shù)據(jù)庫的實例過大,可以理解為,此前的數(shù)據(jù)資產(chǎn)存放的寶箱太大,很難搬運,并且丟失一個寶箱,就會對整體的資產(chǎn)有很大影響,因而需要將這些資產(chǎn)分別存在更小的寶箱中,降低搬運難度。

其次,是網(wǎng)絡(luò)問題,項目組需要在網(wǎng)絡(luò)帶寬上提出創(chuàng)新的技術(shù)解決方案。

第三,「銷售易」的“生產(chǎn)正式”系統(tǒng)體量過于龐大,無法一次性完成。

針對以上三個核心難題,項目組一直圍繞這些問題進行反復的研討和論證,并模擬真實的遷移場景進行預案演練。

到了10月份,項目組終于完成了一套細致的遷移方案,其中的主要技術(shù)難點解決思路包括:

·針對數(shù)據(jù)庫實例過大的問題,在騰訊云端創(chuàng)建多套生產(chǎn)級別數(shù)據(jù)庫實例,并將兩側(cè)云廠商內(nèi)部網(wǎng)絡(luò)進行打通,根據(jù)業(yè)務(wù)特點將過大的實例進行拆分,并使用otter工具實時進行同步,確保拆分和遷移同步順利進行,盡可能縮短遷移時間。

·為了保障遷移過程網(wǎng)絡(luò)穩(wěn)定,做好了小帶寬遷移方案優(yōu)化的準備,通過2根光纖順利完成了遷移工作。

·分類分批遷移:將遷移細化到不同類型的客戶,分批次遷移,確保租戶業(yè)務(wù)不受遷移影響。

一切準備就緒,可以正式「動手了」!

一個小“驚嚇”

北京秋高氣爽的一個深夜,正式的數(shù)據(jù)遷移啟動。

由于前期做了充足的準備,一切按計劃進行,項目組每到晚上夜深人靜之時就開始進行數(shù)據(jù)遷移,一夜接著一夜。到了11月初,90%的數(shù)據(jù)都已經(jīng)切換完成,眼看勝利在望。

距離勝利還差10%的一個周六晚上,按照原計劃,項目組要啟動第二階段BI數(shù)據(jù)的同步,并在第二天等同步完成后進行切割。

這一天夜里,趙文華的電話忽然響了,直覺告訴他,深夜來電話應該沒有什么好事。果然,負責數(shù)據(jù)監(jiān)控遷移的同事告訴他,光纖出現(xiàn)了斷開的情況,數(shù)據(jù)同步出現(xiàn)了停滯。

光纖出現(xiàn)問題的原因有很多,必須馬上搶修,趙文華立刻召集項目組的同事討論解決方案。有人拿出了在做遷移預案的時候已經(jīng)評估的網(wǎng)絡(luò)應急預案,第一時間進行了人工干預和切換。

幾分鐘后,網(wǎng)絡(luò)恢復了正常。被嚇出一身汗的項目組也決定,由于提前數(shù)據(jù)已經(jīng)同步完成,當晚提前完成第二割接,立刻執(zhí)行!

就這樣,當又一個不眠之夜過去,第二階段的任務(wù)完成了。

640.webp (3).jpg

項目最大的數(shù)據(jù)庫進行遷移過程中,因網(wǎng)絡(luò)問題存在短暫數(shù)據(jù)延遲,銷售易團隊緊鑼密鼓地排查問題

一次正確的選擇

經(jīng)過3次大版本的更新,17次小版本迭代,「銷售易」和騰訊云組成的合作項目組最終完成這一浩大的工程。

「這是一次正確的選擇」,趙文華評價說。

其實,對于遷移的效果,大家心里也沒底,所以遷移順利完成后,「銷售易」進行了緊密的檢測,結(jié)果顯示,「系統(tǒng)的整體穩(wěn)定性得到了提升,服務(wù)器自動重啟、數(shù)據(jù)庫異常等問題大大減少」,并且,「每月IT基礎(chǔ)設(shè)施費用的開支節(jié)省了大約23%」。

此外,騰訊云強大的生態(tài)能力也進一步幫助到了「銷售易」的業(yè)務(wù)發(fā)展。作為騰訊SaaS生態(tài)“千帆計劃”的臻選合作伙伴,「銷售易」與騰訊展開多方位合作,拿下眾多行業(yè)頭部客戶。

千帆企業(yè)應用連接器產(chǎn)品幫助「銷售易」解決了實際交付過程中的技術(shù)難題。

國內(nèi)某頭部電商企業(yè)旗下物流集團是銷售易的重要客戶。電商大促時,該物流企業(yè)常常出現(xiàn)流量突刺的問題。但銷售易系統(tǒng)有流量控制,無法處理訂單大并發(fā)的情況,需要快速上線“流量削峰填谷”的能力。

借助千帆iPaaS,「銷售易」三天便實現(xiàn)了與該客戶業(yè)務(wù)系統(tǒng)的集成,相比此前的集成效率提升了約5倍,且在大流量高并發(fā)場景下服務(wù)依然穩(wěn)定可靠。

騰訊千帆iPaaS不但幫助客戶實現(xiàn)了業(yè)務(wù)系統(tǒng)間的數(shù)據(jù)連接,同時極大地提升了「銷售易」交付效率、降低交付成本。

640.webp (4).jpg

數(shù)據(jù)遷移完成后,值守到最后的騰訊云和銷售易聯(lián)合團隊拍了一張合照

目前,「銷售易」的大部分業(yè)務(wù)都平穩(wěn)地在騰訊云上運行,對于這場遷移,不管是「銷售易」服務(wù)的公司,還是最前端的用戶,大家都沒有任何感覺。

這就是做「不停服遷移」的目標,擔憂、焦慮、驚險都留在一個個不眠不休的夜晚,留在了后臺,在每一筆業(yè)務(wù)產(chǎn)生的前臺——太陽升起,一切照舊。

立即登錄,閱讀全文
版權(quán)說明:
本文內(nèi)容來自于騰訊云,本站不擁有所有權(quán),不承擔相關(guān)法律責任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多