點擊上方藍色字體，選擇“標星公眾號”

優(yōu)質(zhì)文章，第一時間送達

作者 | aduner

來源 | urlify.cn/uUZBrm

前言

現(xiàn)代業(yè)務(wù)越來越復(fù)雜，數(shù)據(jù)量也越來越大，關(guān)系型數(shù)據(jù)庫本身就比較容易形成系統(tǒng)瓶頸，單機存儲容量，連接數(shù)，處理能力都有限。

當單表的數(shù)據(jù)量達到一定量級以后，比如1000萬，由于查詢維度較多，即使添加從庫，優(yōu)化索引，做很多操作時性能還是下降嚴重。

這個時候要如何提高數(shù)據(jù)的性能呢？

有人說，可以通過提升服務(wù)器硬件能力來提高數(shù)據(jù)處理能力，比如換更快的硬盤，換更強的CPU。

這種方案成本是很高的，并且瓶頸有時候往往不在硬件上，而在數(shù)據(jù)庫本身。

基于這種現(xiàn)狀，分表/分庫就出現(xiàn)了！

什么是分別分庫

分表分庫是兩種操作，一種是分表，一種是分庫。

但是他們的中心思想都是將數(shù)據(jù)分散，使得單一數(shù)據(jù)庫/表的數(shù)據(jù)量變小來緩解單一數(shù)據(jù)庫的性能問題，從而達到提升數(shù)據(jù)庫性能的目的。

例如，將某業(yè)務(wù)的數(shù)據(jù)庫分為若干個獨立的數(shù)據(jù)庫，并且對于大表也拆分為若干小表，這樣就很大程度上降低了并發(fā)數(shù)據(jù)查詢時的數(shù)據(jù)沖突。

分表

垂直分表

定義：將一個表按照字段分為多表，每個表里面都存儲其中一部分字段。

我們以商品表來舉例子：

商品信息中，一般包括多條字段，如商品名、價格、簡介……

而其中商品名和價格可能是最重要的，而簡介就相對沒有那么重要。

對比兩者：

商品名和價格：字段很小，請求很頻繁。
簡介：字段很大，一般只有詳情頁才需要它。

大字段都如下幾個壞處：

由于數(shù)據(jù)量本身大，需要更長的讀取時間
跨頁時，單頁內(nèi)的數(shù)據(jù)行越多數(shù)據(jù)庫整體性能越好，而大字段占用空間大，單頁內(nèi)存儲行數(shù)小，因此IO效率低
據(jù)庫以行為單位將數(shù)據(jù)加載到內(nèi)存中，表中字段越短，內(nèi)存能加載的數(shù)據(jù)越多，命中率更高，減少了磁盤IO，從而提升了數(shù)據(jù)庫性能。

因此簡介這種低頻數(shù)據(jù)，會拖累商品名和價格這種高頻數(shù)據(jù)，這個時候，我們就可以將簡介從表中拆分出來。

這樣做的好處是：

查看詳情的用戶與商品信息瀏覽互不影響，避免了IO爭搶并減少鎖表的幾率。
充分發(fā)揮高頻數(shù)據(jù)（商品名和價格）的操作效率，商品名和價格的操作的高效率不會被商品簡介的低效率所拖累。

水平分表

定義：同一個數(shù)據(jù)庫內(nèi)，對數(shù)據(jù)行拆分，不影響表結(jié)構(gòu)。

優(yōu)點：

優(yōu)化單一表數(shù)據(jù)量過大而產(chǎn)生的性能問題。
避免IO爭搶而減少鎖表的幾率。

分庫

雖然通過分表性能得到一定程度的提升，但是很多時候還無法達到預(yù)期效果。

因為數(shù)據(jù)庫始終限制在一臺服務(wù)器上，所以分表有如下幾個局限性：

磁盤空間可能不夠。
只解決了單一表數(shù)據(jù)量過大的問題。
每個表還是競爭同一個物理機的物理資源。

垂直分庫

定義：專庫專用，按照業(yè)務(wù)將表進行分類，分布在不同的數(shù)據(jù)庫中，每個庫可以放在不同的服務(wù)器上

例如，我們可以將購物車表、商品表、店鋪表、買家表分在不同的服務(wù)器中。

優(yōu)點：

解決業(yè)務(wù)層面的耦合，業(yè)務(wù)清晰
能對不同業(yè)務(wù)的數(shù)據(jù)進行分級管理、維護、監(jiān)控、擴展等
高并發(fā)場景下，垂直分庫一定程度的提升IO、數(shù)據(jù)庫連接數(shù)、降低單機硬件資源的瓶頸

水平分庫

隨著業(yè)務(wù)的繼續(xù)擴大，垂直分庫也將在次面臨單表過大的情況。

而已經(jīng)經(jīng)過了垂直分庫，我們很難再進行進一步的垂直細分，這時候就要嘗試水平分庫了。

水平分庫和水平分表十分相似，應(yīng)該說就是水平分表是水平分庫的一種延續(xù)。

定義：同一個表的數(shù)據(jù)按一定規(guī)則拆到不同的數(shù)據(jù)庫中，庫放在不同的服務(wù)器上。

優(yōu)點：

解決了單庫大數(shù)據(jù)，高并發(fā)的性能瓶頸
提高了系統(tǒng)的穩(wěn)定性及可用性

分庫分表的缺點

分頁/排序

在同一張表時，只需要用limit、order by便可輕松搞定。

跨節(jié)點多庫進行查詢時，分頁、排序，就變得很復(fù)雜。

先在不同的分片節(jié)點中將數(shù)據(jù)進行排序并返回
然后將不同分片返回的結(jié)果集進行匯總和再次排序

主鍵重復(fù)

分表分庫會讓平時經(jīng)常使用的主鍵自增長形同虛設(shè)。生成的ID無法保證全局唯一。

因此我們需要單獨設(shè)計全局主鍵，以便面跨庫主鍵重復(fù)問題。

事務(wù)的一致性

因為分庫分表把數(shù)據(jù)分布在不同的庫、不同服務(wù)器，所以不可避免的帶來分布式事務(wù)問題。

當一個請求要先請求數(shù)據(jù)庫A，再請求數(shù)據(jù)庫B，這兩個屬于同一個事務(wù)，多個庫會導(dǎo)致分布式事務(wù)問題。

需要有一些措施來保證事務(wù)一致性的問題，這里不在展開，有興趣自行了解。

關(guān)聯(lián)查詢

分庫后，如果兩個表不在同一個數(shù)據(jù)庫，甚至不在同一臺服務(wù)器上，無法進行關(guān)聯(lián)查詢。

解決方案：

將原關(guān)聯(lián)查詢分為兩次查詢
第一個查詢的結(jié)果找出關(guān)聯(lián)數(shù)據(jù)id
根據(jù)id發(fā)起第二次請求得到關(guān)聯(lián)數(shù)據(jù)
最后將獲得的數(shù)據(jù)進行拼裝

總結(jié)

分庫分表的誕生是為了解決數(shù)據(jù)庫的性能瓶頸，雖然有很多好處，但相應(yīng)的也有很多壞處。

但在業(yè)務(wù)量還不大的時候，我們其實應(yīng)該首先考慮索引、緩存、讀寫分離等方案，盲目使用分表分庫技術(shù)，會導(dǎo)致業(yè)務(wù)變得臃腫，反而徒增煩惱。

粉絲福利：Java從入門到入土學(xué)習(xí)路線圖

??????

??長按上方微信二維碼 2 秒

感謝點贊支持下哈

輕松理解分庫分表

前言