干貨 | 16張圖吃透 Redis 架構(gòu)演進
現(xiàn)如今 Redis 變得越來越流行,幾乎在很多項目中被用到。不知道大家有沒有思考過:Redis 到底是如何穩(wěn)定、高性能地提供服務(wù)的?
你可以先嘗試回答一下這些問題:
我使用 Redis 的場景很簡單,只使用單機版 Redis 會有什么問題嗎? 我的 Redis 故障宕機了,數(shù)據(jù)丟失了怎么辦?如何能保證我的業(yè)務(wù)應(yīng)用不受影響? 為什么需要主從集群?它有什么優(yōu)勢? 什么是分片集群?我真的需要分片集群嗎? ...
此外,如果你對 Redis 已經(jīng)有所了解,肯定也聽說過數(shù)據(jù)持久化、主從復(fù)制、哨兵這些概念,它們之間又有什么區(qū)別和聯(lián)系呢?
如果你存在這樣的疑惑,這篇文章,我將帶你掌握:如何從 0 到 1,再從 1 到 N,一步步構(gòu)建出一個穩(wěn)定、高性能的 Redis 集群?
在這個過程中,你可以了解到 Redis 為了做到穩(wěn)定、高性能,都采取了哪些優(yōu)化方案,以及為什么要這么做?
掌握了這些原理,這樣平時你在使用 Redis 時,就能夠做到「游刃有余」。

01 從最簡單的開始:單機版 Redis
首先,我們從最簡單的場景開始。
假設(shè)現(xiàn)在你有一個業(yè)務(wù)應(yīng)用,需要引入 Redis 來提高應(yīng)用的性能,此時你可以選擇部署一個單機版的 Redis 來使用,就像這樣:
這個架構(gòu)非常簡單,你的業(yè)務(wù)應(yīng)用可以把 Redis 當做緩存來使用,從 MySQL 中查詢數(shù)據(jù),然后寫入到 Redis 中,之后業(yè)務(wù)應(yīng)用再從 Redis 中讀取這些數(shù)據(jù),由于 Redis 的數(shù)據(jù)都存儲在內(nèi)存中,所以這個速度飛快。如果你的業(yè)務(wù)體量并不大,那這樣的架構(gòu)模型基本可以滿足你的需求。是不是很簡單?
隨著時間的推移,你的業(yè)務(wù)體量逐漸發(fā)展起來了,Redis 中存儲的數(shù)據(jù)也越來越多,此時你的業(yè)務(wù)應(yīng)用對 Redis 的依賴也越來越重。

這時你應(yīng)該怎么辦?
我猜你的方案肯定是,趕緊重啟 Redis,讓它可以繼續(xù)提供服務(wù)。
但是,因為之前 Redis 中的數(shù)據(jù)都在內(nèi)存中,盡管你現(xiàn)在把 Redis 重啟了,之前的數(shù)據(jù)也都丟失了。重啟后的 Redis 雖然可以正常工作,但是由于 Redis 中沒有任何數(shù)據(jù),業(yè)務(wù)流量還是都會打到后端 MySQL 上,MySQL 的壓力還是很大。
這可怎么辦?你陷入了沉思。
有沒有什么好的辦法解決這個問題?
既然 Redis 只把數(shù)據(jù)存儲在內(nèi)存中,那是否可以把這些數(shù)據(jù)也寫一份到磁盤上呢?
如果采用這種方式,當 Redis 重啟時,我們把磁盤中的數(shù)據(jù)快速恢復(fù)到內(nèi)存中,這樣它就可以繼續(xù)正常提供服務(wù)了。
是的,這是一個很好的解決方案,這個把內(nèi)存數(shù)據(jù)寫到磁盤上的過程,就是「數(shù)據(jù)持久化」。
02 數(shù)據(jù)持久化:有備無患
現(xiàn)在,你設(shè)想的 Redis 數(shù)據(jù)持久化是這樣的:

但是,數(shù)據(jù)持久化具體應(yīng)該怎么做呢?
我猜你最容易想到的一個方案是,Redis 每一次執(zhí)行寫操作,除了寫內(nèi)存之外,同時也寫一份到磁盤上,就像這樣:

沒錯,這是最簡單直接的方案。
但仔細想一下,這個方案有個問題:客戶端的每次寫操作,既需要寫內(nèi)存,又需要寫磁盤,而寫磁盤的耗時相比于寫內(nèi)存來說,肯定要慢很多!這勢必會影響到 Redis 的性能。
如何規(guī)避這個問題?
我們可以這樣優(yōu)化:Redis 寫內(nèi)存由主線程來做,寫內(nèi)存完成后就給客戶端返回結(jié)果,然后 Redis 用另一個線程去寫磁盤,這樣就可以避免主線程寫磁盤對性能的影響。
這確實是一個好方案。除此之外,我們可以換個角度,思考一下還有什么方式可以持久化數(shù)據(jù)?
這時你就要結(jié)合 Redis 的使用場景來考慮了。
回憶一下,我們在使用 Redis 時,通常把它用作什么場景?
是的,緩存。
把 Redis 當做緩存來用,意味著盡管 Redis 中沒有保存全量數(shù)據(jù),對于不在緩存中的數(shù)據(jù),我們的業(yè)務(wù)應(yīng)用依舊可以通過查詢后端數(shù)據(jù)庫得到結(jié)果,只不過查詢后端數(shù)據(jù)的速度會慢一點而已,但對業(yè)務(wù)結(jié)果其實是沒有影響的。
基于這個特點,我們的 Redis 數(shù)據(jù)持久化還可以用「數(shù)據(jù)快照」的方式來做。
那什么是數(shù)據(jù)快照呢?
簡單來講,你可以這么理解:
1、你把 Redis 想象成一個水杯,向 Redis 寫入數(shù)據(jù),就相當于往這個杯子里倒水。
2、此時你拿一個相機給這個水杯拍一張照片,拍照的這一瞬間,照片中記錄到這個水杯中水的容量,就是水杯的數(shù)據(jù)快照。
也就是說,Redis 的數(shù)據(jù)快照,是記錄某一時刻下 Redis 中的數(shù)據(jù),然后只需要把這個數(shù)據(jù)快照寫到磁盤上就可以了。它的優(yōu)勢在于,只在需要持久化時,把數(shù)據(jù)「一次性」寫入磁盤,其它時間都不需要操作磁盤。

其實,上面說的這些持久化方案,就是 Redis 的「RDB」和「AOF」:
RDB:只持久化某一時刻的數(shù)據(jù)快照到磁盤上(創(chuàng)建一個子進程來做) AOF:每一次寫操作都持久到磁盤(主線程寫內(nèi)存,根據(jù)策略可以配置由主線程還是子線程進行數(shù)據(jù)持久化)
它們的區(qū)別除了上面講到的,還有以下特點:
1、RDB 采用二進制 + 數(shù)據(jù)壓縮的方式寫磁盤,這樣文件體積小,數(shù)據(jù)恢復(fù)速度也快。
2、AOF 記錄的是每一次寫命令,數(shù)據(jù)最全,但文件體積大,數(shù)據(jù)恢復(fù)速度慢。
1、如果你的業(yè)務(wù)對于數(shù)據(jù)丟失不敏感,采用 RDB 方案持久化數(shù)據(jù)。
2、如果你的業(yè)務(wù)對數(shù)據(jù)完整性要求比較高,采用 AOF 方案持久化數(shù)據(jù)。
假設(shè)你的業(yè)務(wù)對 Redis 數(shù)據(jù)完整性要求比較高,選擇了 AOF 方案,那此時你又會遇到這些問題:
1、AOF 記錄每一次寫操作,隨著時間增長,AOF 文件體積會越來越大。
2、這么大的 AOF 文件,在數(shù)據(jù)恢復(fù)時變得非常慢。
這怎么辦?數(shù)據(jù)完整性要求變高了,恢復(fù)數(shù)據(jù)也變困難了?有沒有什么方法,可以縮小文件體積?提升恢復(fù)速度呢?
我們繼續(xù)來分析 AOF 的特點。
由于 AOF 文件中記錄的都是每一次寫操作,但對于同一個 key 可能會發(fā)生多次修改,我們只保留最后一次被修改的值,是不是也可以?
是的,這就是我們經(jīng)常聽到的「AOF rewrite」,你也可以把它理解為 AOF 「瘦身」。

回顧一下前面講到的,RDB 和 AOF 各自的特點:
1、RDB 以二進制 + 數(shù)據(jù)壓縮方式存儲,文件體積小。
2、AOF 記錄每一次寫命令,數(shù)據(jù)最全。
我們可否利用它們各自的優(yōu)勢呢?
當然可以,這就是 Redis 的「混合持久化」。

此時,你在使用 AOF 文件恢復(fù)數(shù)據(jù)時,這個恢復(fù)時間就會更短了!
Redis 4.0 以上版本才支持混合持久化。
這么一番優(yōu)化,你的 Redis 再也不用擔心實例宕機了,當發(fā)生宕機時,你就可以用持久化文件快速恢復(fù) Redis 中的數(shù)據(jù)。
但這樣就沒問題了嗎?
仔細想一下,雖然我們已經(jīng)把持久化的文件優(yōu)化到最小了,但在恢復(fù)數(shù)據(jù)時依舊是需要時間的,在這期間你的業(yè)務(wù)應(yīng)用還是會受到影響,這怎么辦?
我們來分析有沒有更好的方案。
一個實例宕機,只能用恢復(fù)數(shù)據(jù)來解決,那我們是否可以部署多個 Redis 實例,然后讓這些實例數(shù)據(jù)保持實時同步,這樣當一個實例宕機時,我們在剩下的實例中選擇一個繼續(xù)提供服務(wù)就好了。
沒錯,這個方案就是接下來要講的「主從復(fù)制:多副本」。
03 主從復(fù)制:多副本

我們這里把實時讀寫的節(jié)點叫做 master,另一個實時同步數(shù)據(jù)的節(jié)點叫做 slave。
采用多副本的方案,它的優(yōu)勢是:
1、縮短不可用時間:master 發(fā)生宕機,我們可以手動把 slave 提升為 master 繼續(xù)提供服務(wù)。

你可以思考一下。
其實,它的問題在于:當 master 宕機時,我們需要「手動」把 slave 提升為 master,這個過程也是需要花費時間的。
雖然比恢復(fù)數(shù)據(jù)要快得多,但還是需要人工介入處理。一旦需要人工介入,就必須要算上人的反應(yīng)時間、操作時間,所以,在這期間你的業(yè)務(wù)應(yīng)用依舊會受到影響。
怎么解決這個問題?我們是否可以把這個切換的過程,變成自動化呢?
對于這種情況,我們需要一個「故障自動切換」機制,這就是我們經(jīng)常聽到的「哨兵」所具備的能力。
04 哨兵:故障自動切換
現(xiàn)在,我們可以引入一個「觀察者」,讓這個觀察者去實時監(jiān)測 master 的健康狀態(tài),這個觀察者就是「哨兵」。
1、哨兵每隔一段時間詢問 master 是否正常。
2、master 正?;貜?fù),表示狀態(tài)正常,回復(fù)超時表示異常。
3、哨兵發(fā)現(xiàn)異常,發(fā)起主從切換。

有了這個方案,就不需要人去介入處理了,一切就變得自動化了,是不是很爽?

這個問題怎么解決?
1、哨兵每隔一段時間詢問 master 是否正常。
2、master 正常回復(fù),表示狀態(tài)正常,回復(fù)超時表示異常。
3、一旦有一個哨兵判定 master 異常(不管是否是網(wǎng)絡(luò)問題),就詢問其它哨兵,如果多個哨兵(設(shè)置一個閾值)都認為 master 異常了,這才判定 master 確實發(fā)生了故障。
4、多個哨兵經(jīng)過協(xié)商后,判定 master 故障,則發(fā)起主從切換。
所以,我們用多個哨兵互相協(xié)商來判定 master 的狀態(tài),這樣一來,就可以大大降低誤判的概率。
哨兵協(xié)商判定 master 異常后,這里還有一個問題:由哪個哨兵來發(fā)起主從切換呢?
答案是,選出一個哨兵「領(lǐng)導(dǎo)者」,由這個領(lǐng)導(dǎo)者進行主從切換。
問題又來了,這個領(lǐng)導(dǎo)者怎么選?
想象一下,在現(xiàn)實生活中,選舉是怎么做的?
是的,投票。
在選舉哨兵領(lǐng)導(dǎo)者時,我們可以制定這樣一個選舉規(guī)則:
1、每個哨兵都詢問其它哨兵,請求對方為自己投票。
2、每個哨兵只投票給第一個請求投票的哨兵,且只能投票一次。
3、首先拿到超過半數(shù)投票的哨兵,當選為領(lǐng)導(dǎo)者,發(fā)起主從切換。
其實,這個選舉的過程就是我們經(jīng)常聽到的:分布式系統(tǒng)領(lǐng)域中的「共識算法」。
什么是共識算法?
我們在多個機器部署哨兵,它們需要共同協(xié)作完成一項任務(wù),所以它們就組成了一個「分布式系統(tǒng)」。
在分布式系統(tǒng)領(lǐng)域,多個節(jié)點如何就一個問題達成共識的算法,就叫共識算法。
在這個場景下,多個哨兵共同協(xié)商,選舉出一個都認可的領(lǐng)導(dǎo)者,就是使用共識算法完成的。
這個算法還規(guī)定節(jié)點的數(shù)量必須是奇數(shù)個,這樣可以保證系統(tǒng)中即使有節(jié)點發(fā)生了故障,剩余超過「半數(shù)」的節(jié)點狀態(tài)正常,依舊可以提供正確的結(jié)果,也就是說,這個算法還兼容了存在故障節(jié)點的情況。
共識算法在分布式系統(tǒng)領(lǐng)域有很多,例如 Paxos、Raft,哨兵選舉領(lǐng)導(dǎo)者這個場景,使用的是 Raft 共識算法,因為它足夠簡單,且易于實現(xiàn)。

好了,到這里我們先小結(jié)一下。
你的 Redis 從最簡單的單機版,經(jīng)過數(shù)據(jù)持久化、主從多副本、哨兵集群,這一路優(yōu)化下來,你的 Redis 不管是性能還是穩(wěn)定性,都越來越高,就算節(jié)點發(fā)生故障,也不用擔心了。
你的 Redis 以這樣的架構(gòu)模式部署,基本上就可以穩(wěn)定運行很長時間了。
...
隨著時間的發(fā)展,你的業(yè)務(wù)體量開始迎來了爆炸性增長,此時你的架構(gòu)模型,還能夠承擔這么大的流量嗎?
我們一起來分析一下:
1、穩(wěn)定性:Redis 故障宕機,我們有哨兵 + 副本,可以自動完成主從切換
2、讀性能:讀請求量增長,我們可以再部署多個 slave,讀寫分離,分擔讀壓力
3、寫性能:寫請求量增長,但我們只有一個 master 實例,這個實例達到瓶頸怎么辦?
看到了么,當你的寫請求量越來越大時,一個 master 實例可能就無法承擔這么大的寫流量了。
要想完美解決這個問題,此時你就需要考慮使用「分片集群」了。
05 分片集群:橫向擴展
什么是「分片集群」?
簡單來講,一個實例扛不住寫壓力,那我們是否可以部署多個實例,然后把這些實例按照一定規(guī)則組織起來,把它們當成一個整體,對外提供服務(wù),這樣不就可以解決集中寫一個實例的瓶頸問題嗎?

現(xiàn)在問題又來了,這么多實例如何組織呢?
我們制定規(guī)則如下:
1、每個節(jié)點各自存儲一部分數(shù)據(jù),所有節(jié)點數(shù)據(jù)之和才是全量數(shù)據(jù)。
2、制定一個路由規(guī)則,對于不同的 key,把它路由到固定一個實例上進行讀寫。
1、客戶端分片
2、服務(wù)端分片

這個方案的缺點是,客戶端需要維護這個路由規(guī)則,也就是說,你需要把路由規(guī)則寫到你的業(yè)務(wù)代碼中。
如何做到不把路由規(guī)則耦合在業(yè)務(wù)代碼中呢?
你可以這樣優(yōu)化,把這個路由規(guī)則封裝成一個模塊,當需要使用時,集成這個模塊就可以了。

Redis Cluster 內(nèi)置了哨兵邏輯,無需再部署哨兵。
當你使用 Redis Cluster 時,你的業(yè)務(wù)應(yīng)用需要使用配套的 Redis SDK,這個 SDK 內(nèi)就集成好了路由規(guī)則,不需要你自己編寫了。
再來看服務(wù)端分片。
這種方案指的是,路由規(guī)則不放在客戶端來做,而是在客戶端和服務(wù)端之間增加一個「中間代理層」,這個代理就是我們經(jīng)常聽到的 Proxy。
而數(shù)據(jù)的路由規(guī)則,就放在這個 Proxy 層來維護。
這樣一來,你就無需關(guān)心服務(wù)端有多少個 Redis 節(jié)點了,只需要和這個 Proxy 交互即可。
Proxy 會把你的請求根據(jù)路由規(guī)則,轉(zhuǎn)發(fā)到對應(yīng)的 Redis 節(jié)點上,而且,當集群實例不足以支撐更大的流量請求時,還可以橫向擴容,添加新的 Redis 實例提升性能,這一切對于你的客戶端來說,都是透明無感知的。

分片集群在數(shù)據(jù)擴容時,還涉及到了很多細節(jié),這塊內(nèi)容不是本文重點,暫不詳述。
至此,當你使用分片集群后,對于未來更大的流量壓力,都可以從容面對了!
06 總結(jié)
好了,我們來總結(jié)一下,我們是如何一步步構(gòu)建一個穩(wěn)定、高性能的 Redis 集群的。
首先,在使用最簡單的單機版 Redis 時,我們發(fā)現(xiàn)當 Redis 故障宕機后,數(shù)據(jù)無法恢復(fù)的問題,因此我們想到了「數(shù)據(jù)持久化」,把內(nèi)存中的數(shù)據(jù)也持久化到磁盤上一份,這樣 Redis 重啟后就可以從磁盤上快速恢復(fù)數(shù)據(jù)。
在進行數(shù)據(jù)持久化時,我們又面臨如何更高效地將數(shù)據(jù)持久化到磁盤的問題。之后我們發(fā)現(xiàn) Redis 提供了 RDB 和 AOF 兩種方案,分別對應(yīng)了數(shù)據(jù)快照和實時的命令記錄。當我們對數(shù)據(jù)完整性要求不高時,可以選擇 RDB 持久化方案。如果對于數(shù)據(jù)完整性要求較高,那么可以選擇 AOF 持久化方案。
但是我們又發(fā)現(xiàn),AOF 文件體積會隨著時間增長變得越來越大,此時我們想到的優(yōu)化方案是,使用 AOF rewrite 的方式對其進行瘦身,減小文件體積,再后來,我們發(fā)現(xiàn)可以結(jié)合 RDB 和 AOF 各自的優(yōu)勢,在 AOF rewrite 時使用兩者結(jié)合的「混合持久化」方式,又進一步減小了 AOF 文件體積。
之后,我們發(fā)現(xiàn)盡管可以通過數(shù)據(jù)恢復(fù)的方式還原數(shù)據(jù),但恢復(fù)數(shù)據(jù)也是需要花費時間的,這意味著業(yè)務(wù)應(yīng)用還是會受到影響。我們進一步優(yōu)化,采用「多副本」的方案,讓多個實例保持實時同步,當一個實例故障時,可以手動把其它實例提升上來繼續(xù)提供服務(wù)。
但是這樣也有問題,手動提升實例上來,需要人工介入,人工介入操作也需要時間,我們開始想辦法把這個流程變得自動化,所以我們又引入了「哨兵」集群,哨兵集群通過互相協(xié)商的方式,發(fā)現(xiàn)故障節(jié)點,并可以自動完成切換,這樣就大幅降低了對業(yè)務(wù)應(yīng)用的影響。
最后,我們把關(guān)注點聚焦在如何支撐更大的寫流量上,所以,我們又引入了「分片集群」來解決這個問題,讓多個 Redis 實例分攤寫壓力,未來面對更大的流量,我們還可以添加新的實例,橫向擴展,進一步提升集群的性能。
至此,我們的 Redis 集群才得以長期穩(wěn)定、高性能的為我們的業(yè)務(wù)提供服務(wù)。
這里我畫了一個思維導(dǎo)圖,方便你更好地去理解它們之間的關(guān)系,以及演化的過程。

07 寫在最后
看到這里,我想你對如何構(gòu)建一個穩(wěn)定、高性能的 Redis 集群問題時,應(yīng)該會有自己的見解了。
其實,這篇文章所講的優(yōu)化思路,圍繞的主題就是「架構(gòu)設(shè)計」的核心思想:
高性能:讀寫分離、分片集群 高可用:數(shù)據(jù)持久化、多副本、故障自動切換 易擴展:分片集群、橫向擴展
當我們講到哨兵集群、分片集群時,這還涉及到了「分布式系統(tǒng)」相關(guān)的知識:
分布式共識:哨兵領(lǐng)導(dǎo)者選舉 負載均衡:分片集群數(shù)據(jù)分片、數(shù)據(jù)路由
當然,除了 Redis 之外,對于構(gòu)建任何一個數(shù)據(jù)集群,你都可以沿用這個思路去思考、去優(yōu)化,看看它們到底是如何做的。
例如當你在使用 MySQL 時,你可以思考一下 MySQL 與 Redis 有哪些不同?MySQL 為了做到高性能、高可用,又是如何做的?思路類似。
本文的思考過程,也是做「架構(gòu)設(shè)計」的思路。在做軟件架構(gòu)設(shè)計時,你面臨的場景就是發(fā)現(xiàn)問題、分析問題、解決問題,一步步去演化、升級你的架構(gòu),最后在性能、可靠性方面達到一個平衡。
雖然各種軟件層出不窮,但架構(gòu)設(shè)計的思想不會變,我希望你真正吸收的是這些思想,這樣才可以做到以不變應(yīng)萬變。
