騰訊云告訴你20分鐘能學到什么？下一代數(shù)據庫

來源：騰訊云數(shù)據庫

作者：騰訊云數(shù)據庫

時間：2021-04-15

炙手可熱的serverless架構，或者稱為無服務器架構，是最近幾年新冒出來的一種技術架構趨勢。

那么，被譽為云計算未來的serverless，有何優(yōu)勢？

在過去不久的全球分布式云大會上，騰訊云數(shù)據庫專家工程師李志陽分享了【分布式數(shù)據庫serverless化：深入解讀無服務器架構下的數(shù)據庫】的主題演講，給出了自己的答案。

Part1 serverless數(shù)據庫特點

隨著業(yè)務專注度的提升，服務的抽象程度也在提高。

李志陽舉了一個汽車服務的例子，以前為了出行只能購買汽車，現(xiàn)在可以使用打車服務，只需知道目的地即可，不再關注開車和保養(yǎng)，核心訴求得到了更好的滿足。

計算服務的演進也是類似，從前自建機房，需要維護機房設備；后來可以在云上直接購買虛擬機，部署業(yè)務，負責服務的擴縮容；現(xiàn)在的函數(shù)計算，從CI/CD到服務部署，擴縮容，全部自動完成，客戶可以更專注于業(yè)務代碼。

狹義的serverless分為FaaS和BaaS，基本特點是無需運維、以API方式提供服務、按實際使用計費、無使用無費用等。舉個例子，用戶瀏覽網頁，可能涉及CDN資源。如果是靜態(tài)內容，從對象存儲下載照片、視頻；如果是動態(tài)內容，則觸發(fā)一個函數(shù)計算，云函數(shù)將從云數(shù)據庫獲取相應的資源，生成用戶所需的動態(tài)內容。其中，云函數(shù)為FaaS，對象存儲和云數(shù)據庫則為BaaS。

傳統(tǒng)的云數(shù)據庫會提供多種內存/CPU規(guī)格給用戶購買。即使無法時刻用滿負載，用戶也需要為選中的規(guī)格付費。如果要將數(shù)據庫serverless化，需要滿足以下三大特性：

第一、自動擴縮容。訪問量上來時自動擴容，降低時自動縮容，用戶不需要關注規(guī)格。

第二、按照實際使用的資源付費。

第三、不使用不計費。如果沒有訪問，不應該收費。

Part2 serverless數(shù)據庫選型

在講述serverless數(shù)據庫選型之前，李志陽先介紹了云數(shù)據庫架構的演進。

640.webp.jpg

圖左側是目前的主流架構—單體冗余架構（一主多從），是現(xiàn)在大部分客戶使用的架構。這類架構存在擴展性問題，實例的升降級和讀擴展，都通過數(shù)據搬遷實現(xiàn)，隨著數(shù)據量的增長，遷移耗時越來越長。

為了解決這個問題，業(yè)界趨勢是采用存算分離架構，衍生出兩類，一類是ShareNothing架構，計算和存儲均支持水平擴展，擴展能力非常強。不過，也存在一些缺點，其中最大的問題是SQL兼容性，解決之道在于持續(xù)構建和完善自己的生態(tài)，讓用戶更好的接受提供的用法。

另一類則是ShareStorage架構，共享存儲架構并沒有改變查詢引擎和ACI這些基礎特性，可以做到100%的兼容性。當然它也有缺點，目前計算節(jié)點沒有提供寫擴展能力，這個也是未來演進的方向。

隨后，李志陽又關注到了Serverless數(shù)據庫的用戶群，主要面向中長尾用戶，他們對擴展性的訴求并不強，更多關注使用的便利性，兼容性是最重要一點。

因此，騰訊云優(yōu)先選擇了基于共享存儲架構的數(shù)據庫產品TDSQL-C提供Serverless服務。

640.webp (1).jpg

李志陽對TDSQL-C的總體架構進行了介紹：TDSQL-C是騰訊云基于共享存儲架構的云原生數(shù)據庫，始于2017年。由于ToB業(yè)務對穩(wěn)定性的要求很高，在設計之初就定下了一個基本原則，即復用云上的成熟組件。

在計算層使用了騰訊維護的MySQL內核分支-TXSQL，復用它的bugfix和新特性；存儲側則選擇了在騰訊內部有十幾年歷史的云硬盤CBS，把CBS的核心存儲和硬盤邏輯進行剖離，打造了統(tǒng)一存儲平臺-HiSTOR。

作為存儲底座，已適配了云硬盤CBS、云分布式文件系統(tǒng)CFS和數(shù)據庫TDSQL-C等多款產品，提供副本同步、故障自動遷移、數(shù)據校驗等一系列完善的數(shù)據安全保障能力，這正是TDSQL-C產品能夠穩(wěn)定運行數(shù)年的重要基石。

另外，它還提供豐富的特性：備份/回檔速度，支持以MB為粒度并發(fā)，速度達到GB/s；除了高性能的SSD，還有混存和EC版本，應對歸檔類的業(yè)務，提供更低成本的存儲。

除了上述兩個關鍵組件，我們還在計算側實現(xiàn)了物理復制，將innodb的redo日志準實時同步到備機，主從延時非常低（小于1毫秒）；相比傳統(tǒng)數(shù)據庫先寫日志后異步刷臟，TDSQL-C只寫日志到存儲，存儲側通過dbstore模塊將日志轉化數(shù)據。日志下沉的優(yōu)點很多，這里不做贅述。

由于騰訊云是國內首家提供Serverless數(shù)據庫的廠家，李志陽主要對比了國外AWS的同類產品Aurora Serverless，并分析如何實現(xiàn)serverless數(shù)據庫的三大特性。

640.webp (2).jpg

一、自動擴縮容：

上圖右側有一個共享的虛擬機池，規(guī)格不盡相同。Aurora Serverless的擴容策略是從1核2G到4核8G逐步遞增規(guī)格。例如需要從1核2G擴大到2核4G，則從池子里面找到2核4G的虛擬機，將對應的數(shù)據盤掛載到虛擬機，并將訪問切到該虛擬機，即可完成自動擴容。有2個問題：1、假設用戶訪問本身需要4核8G，Aurora Serverless仍需要從1核2G開始逐步增加到4核8G，擴容耗時偏長；2、由于選擇新的虛擬機擴容，會導致BP失效，訪問將經歷一次冷啟動過程。

二、按使用量計費：

實現(xiàn)比較簡單，秒級粒度統(tǒng)計正在使用的規(guī)格，按照該規(guī)格計費。

三、不使用不計費：

如果實例超過一段時間沒有訪問，則關閉計算節(jié)點。由于有數(shù)據庫代理節(jié)點作為接入層，如果用戶再有訪問請求，會先到達數(shù)據庫代理節(jié)點。此時，代理節(jié)點按照上面提到的方法，從共享池里面找到對應的虛擬機提供服務。對用戶而言，原有連接不受到影響，只是感覺到一次卡頓。缺點是引入了代理節(jié)點，用戶需要為此付費；另外，恢復時長需要30秒，耗時也比較長。

640.webp (3).jpg

（擴容時BP失效導致的問題）

Part3 TDSQL-C serverless

了解完業(yè)界情況，李志陽開始介紹TDSQL-C Serverless。

640.webp (4).jpg

上圖為總體架構，核心模塊為中控節(jié)點（svls scheduler）。

中控節(jié)點接收計算層采集的內存/CPU/訪問情況等監(jiān)控數(shù)據，根據策略決定是否擴縮容，啟停實例，以及按照計費規(guī)則上報云控制臺計費。

相對Aurora Serverless的區(qū)別在于暫停的應對，TDSQL-C Serverless有faker模塊，暫停計算節(jié)點時會把四層的vip:vport綁定到faker端口，用戶請求過來后，識別為有效的MySQL協(xié)議，則通知中控模塊將實例重新拉起。其優(yōu)點在于用戶不需要為代理節(jié)點付費。

隨后，李志陽詳細解釋了TDSQL-C Serverless如何滿足serverless數(shù)據庫的三大特性。

一、TDSQL-C Serverless的自動擴縮容：

目標是做到秒級的擴縮容，并且期間對用戶是平滑的，無感知的。

640.webp (5).jpg