如何保證MySQL和Redis的數(shù)據(jù)一致性?10張圖帶你搞定!

來源: 云加社區(qū)
作者:徐鑫
時間:2021-10-14
17815
本文的主要思路是首先帶大家認(rèn)識了解MySQL和Redis的數(shù)據(jù)一致性情況,然后進(jìn)行反推不一致的情況,從而進(jìn)行探究單線程中的不一致的情況。同時探究多線程中的不一致的情況,擬定數(shù)據(jù)一致性策略。

一、什么是數(shù)據(jù)的一致性

“數(shù)據(jù)一致”一般指的是:緩存中有數(shù)據(jù),緩存的數(shù)據(jù)值=數(shù)據(jù)庫中的值。但根據(jù)緩存中是有數(shù)據(jù)為依據(jù),則“一致”可以包含兩種情況:

緩存中有數(shù)據(jù),緩存的數(shù)據(jù)值=數(shù)據(jù)庫中的值

緩存中本沒有數(shù)據(jù),數(shù)據(jù)庫中的值=最新值(有請求查詢數(shù)據(jù)庫時,會將數(shù)據(jù)寫入緩存,則變?yōu)樯厦娴摹耙恢隆睜顟B(tài))

“數(shù)據(jù)不一致”:緩存的數(shù)據(jù)值≠數(shù)據(jù)庫中的值;緩存或者數(shù)據(jù)庫中存在舊值,導(dǎo)致其他線程讀到舊數(shù)據(jù)。

二、數(shù)據(jù)不一致性情況及應(yīng)對策略

根據(jù)是否接收寫請求,可以把緩存分成讀寫緩存和只讀緩存。

只讀緩存:只在緩存進(jìn)行數(shù)據(jù)查找,即使用“更新數(shù)據(jù)庫+刪除緩存”策略。

讀寫緩存:需要在緩存中對數(shù)據(jù)進(jìn)行增刪改查,即使用“更新數(shù)據(jù)庫+更新緩存”策略。

(一)針對只讀緩存(更新數(shù)據(jù)庫+刪除緩存)

只讀緩存:新增數(shù)據(jù)時,直接寫入數(shù)據(jù)庫;更新(修改/刪除)數(shù)據(jù)時,先刪除緩存。后續(xù)訪問這些增刪改的數(shù)據(jù)時,會發(fā)生緩存缺失,進(jìn)而查詢數(shù)據(jù)庫,更新緩存。

·新增數(shù)據(jù)時,寫入數(shù)據(jù)庫;訪問數(shù)據(jù)時,緩存缺失,查數(shù)據(jù)庫,更新緩存(始終是處于“數(shù)據(jù)一致”的狀態(tài),不會發(fā)生數(shù)據(jù)不一致性問題)

640.webp.jpg

·更新(修改/刪除)數(shù)據(jù)時,會有個時序問題:更新數(shù)據(jù)庫與刪除緩存的順序(這個過程會發(fā)生數(shù)據(jù)不一致性問題)

在更新數(shù)據(jù)的過程中,可能會有如下問題:

·無并發(fā)請求下,其中一個操作失敗的情況。

·并發(fā)請求下,其他線程可能會讀到舊值

因此,要想達(dá)到數(shù)據(jù)一致性,需要保證兩點(diǎn):

·無并發(fā)請求下,保證A和B步驟都能成功執(zhí)行。

·并發(fā)請求下,在A和B步驟的間隔中,避免或消除其他線程的影響。

接下來,我們針對有/無并發(fā)場景,進(jìn)行分析并使用不同的策略。

·無并發(fā)情況

無并發(fā)請求下,在更新數(shù)據(jù)庫和刪除緩存值的過程中,因?yàn)椴僮鞅徊鸱殖蓛刹?,那么就很有可能存在“步驟1成功,步驟2失敗”的情況發(fā)生(由于單線程中步驟1和步驟2是串行執(zhí)行的,不太可能會發(fā)生“步驟2成功,步驟1失敗”的情況)。

(1)先刪除緩存,再更新數(shù)據(jù)庫

640.webp (2).jpg

(2)先更新數(shù)據(jù)庫,再刪除緩存

640.webp (3).jpg

640.webp (4).jpg

解決策略:

a.消息隊(duì)列+異步重試

無論使用哪一種執(zhí)行時序,可以在執(zhí)行步驟1時,將步驟2的請求寫入消息隊(duì)列,當(dāng)步驟2失敗時,就可以使用重試策略,對失敗操作進(jìn)行“補(bǔ)償”。

640.webp (5).jpg

具體步驟如下:

·把要刪除的緩存值或者是要更新的數(shù)據(jù)庫值暫存到消息隊(duì)列中(例如使用Kafka消息隊(duì)列)

·當(dāng)刪除緩存值或者是更新數(shù)據(jù)庫值成功時,把這些值從消息隊(duì)列中去除,以免重復(fù)操作。

·當(dāng)刪除緩存值或者是更新數(shù)據(jù)庫值失敗時,執(zhí)行失敗策略,重試服務(wù)從消息隊(duì)列中重新讀取這些值,然后再次進(jìn)行刪除或更新。

·刪除或者更新失敗時,需要再次進(jìn)行重試,重試超過的一定次數(shù)。向業(yè)務(wù)層發(fā)送報錯信息。

b.訂閱Binlog變更日志

·創(chuàng)建更新緩存服務(wù),接收數(shù)據(jù)變更的MQ消息,然后消費(fèi)消息,更新/刪除Redis中的緩存數(shù)據(jù)。

·使用Binlog實(shí)時更新/刪除Redis緩存。利用Canal,即將負(fù)責(zé)更新緩存的服務(wù)偽裝成一個MySQL的從節(jié)點(diǎn),從MySQL接收Binlog,解析Binlog之后,得到實(shí)時的數(shù)據(jù)變更信息,然后根據(jù)變更信息去更新/刪除Redis緩存。

·MQ+Canal策略,將Canal Server接收到的Binlog數(shù)據(jù)直接投遞到MQ進(jìn)行解耦,使用MQ異步消費(fèi)Binlog日志,以此進(jìn)行數(shù)據(jù)同步。

不管用MQ/Canal或者M(jìn)Q+Canal的策略來異步更新緩存,對整個更新服務(wù)的數(shù)據(jù)可靠性和實(shí)時性要求都比較高,如果產(chǎn)生數(shù)據(jù)丟失或者更新延時情況,會造成MySQL和Redis中的數(shù)據(jù)不一致。因此,使用這種策略時,需要考慮出現(xiàn)不同步問題時的降級或補(bǔ)償方案。

·高并發(fā)情況

使用以上策略后,可以保證在單線程/無并發(fā)場景下的數(shù)據(jù)一致性。但是,在高并發(fā)場景下,由于數(shù)據(jù)庫層面的讀寫并發(fā),會引發(fā)的數(shù)據(jù)庫與緩存數(shù)據(jù)不一致的問題(本質(zhì)是后發(fā)生的讀請求先返回了)

(1)先刪除緩存,再更新數(shù)據(jù)庫

假設(shè)線程A刪除緩存值后,由于網(wǎng)絡(luò)延遲等原因?qū)е挛醇案聰?shù)據(jù)庫,而此時,線程B開始讀取數(shù)據(jù)時會發(fā)現(xiàn)緩存缺失,進(jìn)而去查詢數(shù)據(jù)庫。而當(dāng)線程B從數(shù)據(jù)庫讀取完數(shù)據(jù)、更新了緩存后,線程A才開始更新數(shù)據(jù)庫,此時,會導(dǎo)致緩存中的數(shù)據(jù)是舊值,而數(shù)據(jù)庫中的是最新值,產(chǎn)生“數(shù)據(jù)不一致”。其本質(zhì)就是,本應(yīng)后發(fā)生的“B線程-讀請求”先于“A線程-寫請求”執(zhí)行并返回了。

640.webp (6).jpg

或者

640.webp (7).jpg

解決策略:

設(shè)置緩存過期時間+延時雙刪

通過設(shè)置緩存過期時間,若發(fā)生上述淘汰緩存失敗的情況,則在緩存過期后,讀請求仍然可以從DB中讀取最新數(shù)據(jù)并更新緩存,可減小數(shù)據(jù)不一致的影響范圍。雖然在一定時間范圍內(nèi)數(shù)據(jù)有差異,但可以保證數(shù)據(jù)的最終一致性。

此外,還可以通過延時雙刪進(jìn)行保障:在線程A更新完數(shù)據(jù)庫值以后,讓它先sleep一小段時間,確保線程B能夠先從數(shù)據(jù)庫讀取數(shù)據(jù),再把缺失的數(shù)據(jù)寫入緩存,然后,線程A再進(jìn)行刪除。后續(xù)其它線程讀取數(shù)據(jù)時,發(fā)現(xiàn)緩存缺失,會從數(shù)據(jù)庫中讀取最新值。

redis.delKey(X)

db.update(X)

Thread.sleep(N)

redis.delKey(X)

sleep時間:在業(yè)務(wù)程序運(yùn)行的時候,統(tǒng)計(jì)下線程讀數(shù)據(jù)和寫緩存的操作時間,以此為基礎(chǔ)來進(jìn)行估算。

640.webp (8).jpg

注意:如果難以接受sleep這種寫法,可以使用延時隊(duì)列進(jìn)行替代。

先刪除緩存值再更新數(shù)據(jù)庫,有可能導(dǎo)致請求因緩存缺失而訪問數(shù)據(jù)庫,給數(shù)據(jù)庫帶來壓力,也就是緩存穿透的問題。針對緩存穿透問題,可以用緩存空結(jié)果、布隆過濾器進(jìn)行解決。

(2)先更新數(shù)據(jù)庫,再刪除緩存

如果線程A更新了數(shù)據(jù)庫中的值,但還沒來得及刪除緩存值,線程B就開始讀取數(shù)據(jù)了,那么此時,線程B查詢緩存時,發(fā)現(xiàn)緩存命中,就會直接從緩存中讀取舊值。其本質(zhì)也是,本應(yīng)后發(fā)生的“B線程-讀請求”先于“A線程-刪除緩存”執(zhí)行并返回了。

640.webp (9).jpg

或者,在“先更新數(shù)據(jù)庫,再刪除緩存”方案下,“讀寫分離+主從庫延遲”也會導(dǎo)致不一致:

640.webp (10).jpg

解決方案:

a.延遲消息

憑借經(jīng)驗(yàn)發(fā)送「延遲消息」到隊(duì)列中,延遲刪除緩存,同時也要控制主從庫延遲,盡可能降低不一致發(fā)生的概率。

b.訂閱binlog,異步刪除

通過數(shù)據(jù)庫的binlog來異步淘汰key,利用工具(canal)將binlog日志采集發(fā)送到MQ中,然后通過ACK機(jī)制確認(rèn)處理刪除緩存。

c.刪除消息寫入數(shù)據(jù)庫

通過比對數(shù)據(jù)庫中的數(shù)據(jù),進(jìn)行刪除確認(rèn)先更新數(shù)據(jù)庫再刪除緩存,有可能導(dǎo)致請求因緩存缺失而訪問數(shù)據(jù)庫,給數(shù)據(jù)庫帶來壓力,也就是緩存穿透的問題。針對緩存穿透問題,可以用緩存空結(jié)果、布隆過濾器進(jìn)行解決。

d.加鎖

更新數(shù)據(jù)時,加寫鎖;查詢數(shù)據(jù)時,加讀鎖。

640.webp (11).jpg

建議:

優(yōu)先使用“先更新數(shù)據(jù)庫再刪除緩存”的執(zhí)行時序,原因主要有兩個:

·先刪除緩存值再更新數(shù)據(jù)庫,有可能導(dǎo)致請求因緩存缺失而訪問數(shù)據(jù)庫,給數(shù)據(jù)庫帶來壓力。

·業(yè)務(wù)應(yīng)用中讀取數(shù)據(jù)庫和寫緩存的時間有時不好估算,進(jìn)而導(dǎo)致延遲雙刪中的sleep時間不好設(shè)置。

(二)針對讀寫緩存(更新數(shù)據(jù)庫+更新緩存)

讀寫緩存:增刪改在緩存中進(jìn)行,并采取相應(yīng)的回寫策略,同步數(shù)據(jù)到數(shù)據(jù)庫中。

同步直寫:使用事務(wù),保證緩存和數(shù)據(jù)更新的原子性,并進(jìn)行失敗重試(如果Redis本身出現(xiàn)故障,會降低服務(wù)的性能和可用性)

異步回寫:寫緩存時不同步寫數(shù)據(jù)庫,等到數(shù)據(jù)從緩存中淘汰時,再寫回?cái)?shù)據(jù)庫(沒寫回?cái)?shù)據(jù)庫前,緩存發(fā)生故障,會造成數(shù)據(jù)丟失)

該策略在秒殺場中有見到過,業(yè)務(wù)層直接對緩存中的秒殺商品庫存信息進(jìn)行操作,一段時間后再回寫數(shù)據(jù)庫。

一致性:同步直寫>異步回寫,因此,對于讀寫緩存,要保持?jǐn)?shù)據(jù)強(qiáng)一致性的主要思路是:利用同步直寫,同步直寫也存在兩個操作的時序問題:更新數(shù)據(jù)庫和更新緩存。

·無并發(fā)情況

640.webp (12).jpg

·高并發(fā)情況

有四種場景會造成數(shù)據(jù)不一致:

640.webp (13).jpg

針對場景1和2的解決方案是:保存請求對緩存的讀取記錄,延時消息比較,發(fā)現(xiàn)不一致后,做業(yè)務(wù)補(bǔ)償針對場景3和4的解決方案是:對于寫請求,需要配合分布式鎖使用。寫請求進(jìn)來時,針對同一個資源的修改操作,先加分布式鎖,保證同一時間只有一個線程去更新數(shù)據(jù)庫和緩存;沒有拿到鎖的線程把操作放入到隊(duì)列中,延時處理。用這種方式保證多個線程操作同一資源的順序性,以此保證一致性。

640.webp (14).jpg

其中,分布式鎖的實(shí)現(xiàn)可以使用以下策略:

640.webp (15).jpg

(三)強(qiáng)一致性策略

上述策略只能保證數(shù)據(jù)的最終一致性。要想做到強(qiáng)一致,最常見的方案是2PC、3PC、Paxos、Raft這類一致性協(xié)議,但它們的性能往往比較差,而且這些方案也比較復(fù)雜,還要考慮各種容錯問題。如果業(yè)務(wù)層要求必須讀取數(shù)據(jù)的強(qiáng)一致性,可以采取以下策略:

·暫存并發(fā)讀請求

在更新數(shù)據(jù)庫時,先在Redis緩存客戶端暫存并發(fā)讀請求,等數(shù)據(jù)庫更新完、緩存值刪除后,再讀取數(shù)據(jù),從而保證數(shù)據(jù)一致性。

·串行化

讀寫請求入隊(duì)列,工作線程從隊(duì)列中取任務(wù)來依次執(zhí)行

·修改服務(wù)Service連接池,id取模選取服務(wù)連接,能夠保證同一個數(shù)據(jù)的讀寫都落在同一個后端服務(wù)上。

·修改數(shù)據(jù)庫DB連接池,id取模選取DB連接,能夠保證同一個數(shù)據(jù)的讀寫在數(shù)據(jù)庫層面是串行的。

·使用Redis分布式讀寫鎖

將淘汰緩存與更新庫表放入同一把寫鎖中,與其它讀請求互斥,防止其間產(chǎn)生舊數(shù)據(jù)。讀寫互斥、寫寫互斥、讀讀共享,可滿足讀多寫少的場景數(shù)據(jù)一致,也保證了并發(fā)性。并根據(jù)邏輯平均運(yùn)行時間、響應(yīng)超時時間來確定過期時間。

public void write() {

    Lock writeLock = redis.getWriteLock(lockKey);

    writeLock.lock();

    try {

        redis.delete(key);

        db.update(record);

    } finally {

        writeLock.unlock();

    }

}


public void read() {

    if (caching) {

        return;

    }

    // no cache

    Lock readLock = redis.getReadLock(lockKey);

    readLock.lock();

    try {

        record = db.get();

    } finally {

        readLock.unlock();

    }

    redis.set(key, record);

}

(四)小結(jié)

640.webp (1).jpg

針對讀寫緩存時:同步直寫,更新數(shù)據(jù)庫+更新緩存

640.webp (2).jpg

針對只讀緩存時:更新數(shù)據(jù)庫+刪除緩存

640.webp (3).jpg

較為通用的一致性策略擬定:

在并發(fā)場景下,使用“更新數(shù)據(jù)庫+更新緩存”需要用分布式鎖保證緩存和數(shù)據(jù)一致性,且可能存在“緩存資源浪費(fèi)”和“機(jī)器性能浪費(fèi)”的情況;一般推薦使用“更新數(shù)據(jù)庫+刪除緩存”的方案。如果根據(jù)需要,熱點(diǎn)數(shù)據(jù)較多,可以使用“更新數(shù)據(jù)庫+更新緩存”策略。

在“更新數(shù)據(jù)庫+刪除緩存”的方案中,推薦使用推薦用“先更新數(shù)據(jù)庫,再刪除緩存”策略,因?yàn)橄葎h除緩存可能會導(dǎo)致大量請求落到數(shù)據(jù)庫,而且延遲雙刪的時間很難評估。

在“先更新數(shù)據(jù)庫,再刪除緩存”策略中,可以使用“消息隊(duì)列+重試機(jī)制”的方案保證緩存的刪除。并通過“訂閱binlog”進(jìn)行緩存比對,加上一層保障。

此外,需要通過初始化緩存預(yù)熱、多數(shù)據(jù)源觸發(fā)、延遲消息比對等策略進(jìn)行輔助和補(bǔ)償?!径喾N數(shù)據(jù)更新觸發(fā)源:定時任務(wù)掃描,業(yè)務(wù)系統(tǒng)MQ、binlog變更MQ,相互之間作為互補(bǔ)來保證數(shù)據(jù)不會漏更新】

三、數(shù)據(jù)不一致性需注意其他問題

(一)k-v大小的合理設(shè)置

Redis key大小設(shè)計(jì):由于網(wǎng)絡(luò)的一次傳輸MTU最大為1500字節(jié),所以為了保證高效的性能,建議單個k-v大小不超過1KB,一次網(wǎng)絡(luò)傳輸就能完成,避免多次網(wǎng)絡(luò)交互;k-v是越小性能越好

Redis熱key:當(dāng)業(yè)務(wù)遇到單個讀熱key,通過增加副本來提高讀能力或是用hashtag把key存多份在多個分片中。

當(dāng)業(yè)務(wù)遇到單個寫熱key,需業(yè)務(wù)拆分這個key的功能,屬于設(shè)計(jì)不合理-當(dāng)業(yè)務(wù)遇到熱分片,即多個熱key在同一個分片上導(dǎo)致單分片cpu高,可通過hashtag方式打散。

(二)避免其他問題導(dǎo)致緩存服務(wù)器崩潰,進(jìn)而簡直導(dǎo)致數(shù)據(jù)一致性策略失效緩存穿透、緩存擊穿、緩存雪崩、機(jī)器故障等問題

640.webp (4).jpg

(三)方案選定的思路

`確定緩存類型(讀寫/只讀)

`確定一致性級別

`確定同步/異步方式

`選定緩存流程

`補(bǔ)充細(xì)節(jié)

參考資料:

1.Redis與MySQL雙寫一致性如何保證

2.干貨|攜程最終一致和強(qiáng)一致性緩存實(shí)踐

3.大廠都是怎么做MySQL to Redis同步的

4.緩存與數(shù)據(jù)庫一致性策略

5.緩存與數(shù)據(jù)庫一致性保證

6.如何解決緩存和數(shù)據(jù)庫的數(shù)據(jù)不一致問題

7.Redis經(jīng)典問題,緩存(穿透,雪崩,擊穿,數(shù)據(jù)不一致,數(shù)據(jù)并發(fā)競爭,HotKey,BigKey),分布式鎖(watch樂觀鎖,setnx,Redisson)

8.Redisson分布式鎖場景和使用

立即登錄,閱讀全文
版權(quán)說明:
本文內(nèi)容來自于云加社區(qū),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個人觀點(diǎn),不代表快出海對觀點(diǎn)贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
個人VIP