伊人天天干,国产精品秘久,秘书激情办公室在线观看,欧美三级片在线观看,中文字幕一区二区三区免费2023,不知火舞撅起屁股求调教,亚洲视频综合,99久久网

TiCDC 作為 TiDB 的數(shù)據(jù)同步組件，負責直接從 TiKV 獲取數(shù)據(jù)變更信息并同步到下游。其中比較核心的問題是數(shù)據(jù)解析正確性問題，具體而言就是如何使用正確的 schema 解析 TiKV 傳遞過來的 Key-Value 數(shù)據(jù)，從而還原成正確的 SQL 或者其他下游支持的形式。本文主要通過對 TiDB Online DDL 機制原理和實現(xiàn)的分析，引出對當前 TiCDC 數(shù)據(jù)解析實現(xiàn)的討論。

背景和問題

數(shù)據(jù)同步組件是數(shù)據(jù)庫生態(tài)中不可或缺的生態(tài)工具，比較知名的開源單機數(shù)據(jù)庫 MySQL 就將數(shù)據(jù)同步作為 Server 能力的一部分，并基于 MySQL binlog 實現(xiàn)異步/半同步/同步的主從復制。由于 MySQL 悲觀事務模型和表元數(shù)據(jù)鎖的存在，我們總是可以認為 MySQL binlog 中存在因果關系的 data 和 schema 符合時間先后順序的，即：

New data commitTs > New schema commitTs

但是對于 TiDB 這種存儲計算分離的架構(gòu)而言，schema 的變更在存儲層持久化，服務層節(jié)點作為多緩存節(jié)點，總是存在一個 schema 狀態(tài)不一致的時間段。為了保證數(shù)據(jù)一致性和實現(xiàn)在線 DDL 變更，現(xiàn)有的分布式數(shù)據(jù)庫大都采用或者借鑒了Online, Asynchronous Schema Change in F1 機制。所以我們要回答的問題變成了，在 TiDB Online DDL 機制下，TiCDC 如何正確處理 data 和 schema 的對應關系，存在因果關系的 data 和 schema 是否仍然滿足：

New data commitTs > New schema commitTs

為了回答這個問題，我們首先需要先闡述原始的 F1 Online Schema Change 機制的核心原理，然后描述當前 TiDB Online DDL 實現(xiàn)，最后我們討論在當前 TiCDC 實現(xiàn)下，data 和 schema 的處理關系和可能出現(xiàn)的不同的異常場景。

F1 Online Schema Change 機制

F1 Online Schema Change 機制要解決的核心問題是，在單存儲多緩存節(jié)點的架構(gòu)下，如何實現(xiàn)滿足數(shù)據(jù)一致性的 Online Schema 變更，如圖 1 所示：

圖 1: 單存儲多緩存節(jié)點的架構(gòu)下的 schema 變更

這里我們定義數(shù)據(jù)不一致問題為數(shù)據(jù)多余(orphan data anomaly)和數(shù)據(jù)缺失(integrity anomaly)，Schema 變更結(jié)束后出現(xiàn)數(shù)據(jù)多余和數(shù)據(jù)缺失我們就認為數(shù)據(jù)不一致了。這類系統(tǒng)的 schema 變更問題特點可以總結(jié)成以下 3 點：

1. 一份 schema 存儲，多份 schema 緩存

2. 部分 new schema 和 old schema 無法共存

3. 直接從 old schema 變更到 new schema 時，總是存在一個時間區(qū)間兩者同時存在

特點 1 和特點 3 是系統(tǒng)架構(gòu)導致的，比較容易理解。特點 2 的一個典型例子是 add index，加載了 new schema 的服務層節(jié)點插入數(shù)據(jù)時會同時插入索引，而加載了 old schema 的服務層節(jié)點執(zhí)行刪除操作只會刪除數(shù)據(jù)，導致出現(xiàn)了沒有指向的索引, 出現(xiàn)數(shù)據(jù)多余。

Schema 變更問題的特點 2 和特點 3 看起來是互相矛盾的死結(jié)，new schema 和 old schema 無法共存，但又必然共存。而 F1 Online Schema 機制提供的解決方案也很巧妙，改變不了結(jié)果就改變條件。所以該論文的解決思路上主要有 2 點，如圖 2 所示：

圖 2: F1 Online DDL 解決方案

1. 引入共存的中間 schema 狀態(tài)，比如 S1->S2’->S2, S1 和 S2’ 可以共存，S2’ 和 S2 可以共存；

2. 引入確定的隔離時間區(qū)間，保證無法共存的 schema 不會同時出現(xiàn)；

具體來講：

引入共存的中間 schema 狀態(tài)

因為直接從 schema S1 變更到 schema S2 會導致數(shù)據(jù)不一致的問題，所以引入了 delete-only 和 write-only 中間狀態(tài)，從 S1 -> S2 過程變成 S1 -> S2+delete-only -> S2+write-only -> S2 過程，同時使用 lease 機制保證同時最多有 2 個狀態(tài)共存。這時只需要證明每相臨的兩個狀態(tài)都是可以共存的，保證數(shù)據(jù)一致性，就能推導出 S1 到 S2 變更過程中數(shù)據(jù)是一致的。

引入確定的隔離時間區(qū)間

定義 schema lease，超過 lease 時長后節(jié)點需要重新加載 schema，加載時超過 lease 之后沒法獲取 new schema 的節(jié)點直接下線，不提供服務。所以可以明確定義 2 倍 lease 時間之后，所有節(jié)點都會更新到下一個的 schema。

引入共存的中間狀態(tài)

我們需要引入什么樣的中間狀態(tài)呢？那要看我們需要解決什么問題。這里我們?nèi)匀皇褂?add index 這個 DDL 作為例子，其他 DDL 細節(jié)可以查閱 Online, Asynchronous Schema Change in F1。

Delete-only 狀態(tài)

我們可以看到 old schema 是無法看到索引信息的，所以會導致出現(xiàn)刪除數(shù)據(jù)，遺留沒有指向的索引這種數(shù)據(jù)多余的異常場景，所以我們要引入的第一個中間狀態(tài)是 delete-only 狀態(tài)，賦予 schema 刪除索引的能力。在 delete-only 狀態(tài)下，schema 只能在 delete 操作的時候?qū)λ饕M行刪除，在 insert/select 操作的時候無法操作索引，如圖 3 所示：

圖 3: 引入 delete-only 中間狀態(tài)

原始論文對于 delete-only 的定義如下：

假設我們已經(jīng)引入了明確的隔離時間區(qū)間（下一個小節(jié)會細講），能保證同一時刻最多只出現(xiàn) 2 個 schema 狀態(tài)。所以當我們引入 delete-only 狀態(tài)之后，需要考慮的場景就變成：

1. old schema + new schema(delete-only)

2. new schema(delete-only) + new schema

對于場景 1，所有的服務層節(jié)點要么處于 old schema 狀態(tài)，要么處于 new schema(delete-only) 狀態(tài)。由于 index 只能在 delete 的時候被操作，所以根本沒有 index 生成，就不會出現(xiàn)前面說的遺留沒有指向的索引問題，也不會有數(shù)據(jù)缺失問題，此時數(shù)據(jù)是一致的。我們可以說 old schema 和 new schema(delete-only) 是可以共存的。
對于場景 2，所有的服務層節(jié)點要么處于 new schema(delete-only) 狀態(tài)，要么處于 new schema 狀態(tài)。處于 new schema 狀態(tài)的節(jié)點可以正常插入刪除數(shù)據(jù)和索引，處于 new schema( delete-only) 狀態(tài)的節(jié)點只能插入數(shù)據(jù)，但是可以刪除數(shù)據(jù)和索引，此時存在部分數(shù)據(jù)缺少索引問題，數(shù)據(jù)是不一致的。

引入 delete-only 狀態(tài)之后，已經(jīng)解決了之前提到的索引多余的問題，但是可以發(fā)現(xiàn)，處于 new schema( delete-only) 狀態(tài)的節(jié)點只能插入數(shù)據(jù)，導致新插入的數(shù)據(jù)和存量歷史數(shù)據(jù)都缺少索引信息，仍然存在數(shù)據(jù)缺失的數(shù)據(jù)不一致問題。

Write-only 狀態(tài)

在場景 2 中我們可以看到，對于 add index 這種場景，處于 new schema( delete-only) 狀態(tài)節(jié)點插入的數(shù)據(jù)和存量數(shù)據(jù)都存在索引缺失的問題。而存量數(shù)據(jù)本身數(shù)量是確定且有限的，總可以在有限的時間內(nèi)根據(jù)數(shù)據(jù)生成索引，但是 new insert 的數(shù)據(jù)卻可能隨時間不斷增加。為了解決這個數(shù)據(jù)缺失的問題，我們還需要引入第二個中間狀態(tài) write-only 狀態(tài)，賦予 schema insert/delete 索引的能力。處于 write-only 狀態(tài)的節(jié)點可以 insert/delete/update 索引，但是 select 無法看到索引，如圖 4 所示：

圖 4: 引入 write-only 狀態(tài)

原始論文中對于 write-only 狀態(tài)的定義如下：

引入 write-only 狀態(tài)之后，上述的場景 2 被切分成了場景 2' 和場景 3:

2'：new schema(delete-only) + new schema(write-only)

3：new schema(write-only) + new schema

對于場景 2'，所有的服務層節(jié)點要么處于 new schema(delete-only) 狀態(tài)，要么處于 new schema(write-only) 。處于 new schema(delete-only) 狀態(tài)的服務層節(jié)點只能插入數(shù)據(jù)，但是可以刪除數(shù)據(jù)和索引，處于 new schema(write-only) 可以正常插入和刪除數(shù)據(jù)和索引。此時仍然存在索引缺失的問題，但是由于 delete-only 和 write-only 狀態(tài)下，索引對于用戶都是不可見的，所以在用戶的視角上，只存在完整的數(shù)據(jù)，不存在任何索引，所以內(nèi)部的索引缺失對用戶而言還是滿足數(shù)據(jù)一致性的。
對于場景 3，所有的服務層節(jié)點要么處于 new schema(write-only) 狀態(tài)，要么處于 new schema。此時 new insert 的數(shù)據(jù)都能正常維護索引，而存量歷史數(shù)據(jù)仍然存在缺失索引的問題。但是存量歷史數(shù)據(jù)是確定且有限的，我們只需要在所有節(jié)點過渡到 write-only 之后，進行歷史數(shù)據(jù)索引補全，再過渡到 new schema 狀態(tài)，就可以保證數(shù)據(jù)和索引都是完整的。此時處于 write-only 狀態(tài)的節(jié)點只能看到完整的數(shù)據(jù)，而 new schema 狀態(tài)的節(jié)點能看到完整的數(shù)據(jù)和索引，所以對于用戶而言數(shù)據(jù)都是一致的。

小節(jié)總結(jié)

通過上面對 delete-only 和 write-only 這兩個中間狀態(tài)的表述，我們可以看到，在 F1 Online DDL 流程中，原來的單步 schema 變更被兩個中間狀態(tài)分隔開了。每兩個狀態(tài)之間都是可以共存的，每次狀態(tài)變更都能保證數(shù)據(jù)一致性，全流程的數(shù)據(jù)變更也能保證數(shù)據(jù)一致性。

引入確定的隔離時間區(qū)間

為了保證同一時刻最多只能存在 2 種狀態(tài)，需要約定服務層節(jié)點加載 schema 的行為：

1. 所有的服務層節(jié)點在 lease 之后都需要重新加載 schema；

2. 如果在 lease 時間內(nèi)無法獲取 new schema，則下線拒絕服務；

通過對服務層節(jié)點加載行為的約定，我們可以得到一個確定的時間邊界，在 2*lease 的時間周期之后，所有正常工作的服務層節(jié)點都能從 schema state1 過渡到 schema state2, 如圖 5 所示：

圖 5: 最多 2*lease 時長后所有的節(jié)點都能過渡到下一個狀態(tài)

中間狀態(tài)可見性

要正確理解原始論文的中間狀態(tài)，需要正確理解中間狀態(tài)的可見性問題。前面小節(jié)為了方便我們一直使用 add index 作為例子，然后表述 delete-only 和 write-only 狀態(tài)下索引對于用戶 select 是不可見的，但是 write-only 狀態(tài)下，delete/insert 都是可以操作索引的。如果 DDL 換成 add column，那節(jié)點處于 write-only 狀態(tài)時，用戶 insert 顯式指定新增列可以執(zhí)行成功嗎？答案是不能。

總的來說，中間狀態(tài)的 delete/insert 可見性是內(nèi)部可見性，具體而言是服務層節(jié)點對存儲層節(jié)點的可見性，而不是用戶可見性。對于 add column 這個 DDL，服務層節(jié)點在 delete-only 和 write-only 狀態(tài)下就能看到 new column，但是操作受到不同的限制。對用戶而言，只有到 new schema 狀態(tài)下才能看到 new column，才能顯式操作 new column，如圖 6 所示：

圖 6: 中間狀態(tài)可見性

為了清晰表述可見性，我們舉個例子，如圖 7 所示。原始的表列信息為 , DDL 操作之后表列信息為。

圖 7: 中間狀態(tài)過渡

小圖 (1) 中，服務層節(jié)點已經(jīng)過渡到了場景 1，部分節(jié)點處于 old schema 狀態(tài)，部分節(jié)點處于 new schema(delete-only) 狀態(tài)。此時 c2 對用戶是不可見的，不管是 insert < c1,c2> 還是 delete的顯式指定 c2 都是失敗的。但是存儲層如果存在 [1,xxx] 這樣的數(shù)據(jù)是可以順利刪除的，只能插入 [7] 這樣的缺失 c2 的行數(shù)據(jù)。
小圖 (2) 中，服務層節(jié)點已經(jīng)過渡到了場景 2，部分節(jié)點處于 new schema(delete-only) 狀態(tài)，部分節(jié)點處于 new schema(write-only) 狀態(tài)，此時 c2 對用戶仍是不可見的，不管是 insert <c1,c2> 還是 delete的顯式指定 c2 都是失敗的。但是處于 write-only 狀態(tài)的節(jié)點，insert [9] 在內(nèi)部會被默認值填充成 [9,0] 插入存儲層。處于 delete-only 狀態(tài)的節(jié)點，delete [9] 會被轉(zhuǎn)成 delete [9,0]。

小圖 (3) 中，服務層所有節(jié)點都過渡到 write-only 之后，c2 對用戶仍是不可見的。此時開始進行數(shù)據(jù)填充，將歷史數(shù)據(jù)中缺失 c2 的行進行填充(實現(xiàn)時可能只是在表的列信息中打上一個標記，取決于具體的實現(xiàn))。
小圖 (4) 中，開始過渡到場景 3，部分節(jié)點處于 new schema(write-only) 狀態(tài)，部分節(jié)點處于 new schema 狀態(tài)。處于 new schema(write-only) 狀態(tài)的節(jié)點，c2 對用戶仍是不可見的。處于 new schema 狀態(tài)的節(jié)點，c2 對用戶可見。此時連接在不同服務層節(jié)點上的用戶，可以看到不同的的 select 結(jié)果，不過底層的數(shù)據(jù)是完整且一致的。

總結(jié)

上面我們通過 3 個小節(jié)對 F1 online Schema 機制進行了簡要描述。原來單步 schema 變更被拆解成了多個中間變更流程，從而保證數(shù)據(jù)一致性的前提下實現(xiàn)了在線 DDL 變更。

對于 add index 或者 add column DDL 是上述的狀態(tài)變更，對于 drop index 或者 drop column 則是完全相反的過程。比如 drop column 在 write-only 階段及之后對用戶都不可見了，內(nèi)部可以正確 insert/delete，可見性和之前的論述完全一樣。

TiDB Online DDL 實現(xiàn)

TiDB Online DDL 是基于 F1 Online Schema 實現(xiàn)的，整體流程如圖 8 所示：

圖 8 TiDB Online DDL 流程

簡單描述如下：

TiDB Server 節(jié)點收到 DDL 變更時，將 DDL SQL 包裝成 DDL job 提交到 TIKV job queue 中持久化；
TiDB Server 節(jié)點選舉出 Owner 角色，從 TiKV job queue 中獲取 DDL job，負責具體執(zhí)行 DDL 的多階段變更；
DDL 的每個中間狀態(tài)(delete-only/write-only/write-reorg)都是一次事務提交，持久化到 TiKV job queue 中;
Schema 變更成功之后，DDL job state 會變更成 done/sync，表示 new schema 正式被用戶看到，其他 job state 比如 cancelled/rollback done 等表示 schema 變更失??；
Schema state 的變更過程中使用了 etcd 的訂閱通知機制，加快 server 層各節(jié)點間 schema state 同步，縮短 2*lease 的變更時間；
DDL job 處于 done/sync 狀態(tài)之后，表示該 DDL 變更已經(jīng)結(jié)束，移動到 job history queue 中；

詳細的 TiDB 處理流程可以參見：schema-change-implement.md 和 TiDB ddl.html

TiCDC 中 Data 和 Schema 處理關系

前面我們分別描述了 TiDB Online DDL 機制的原理和實現(xiàn)，現(xiàn)在我們可以回到最一開始我們提出的問題：在 TiDB Online DDL 機制下，是否還能滿足：

New data commitTs > New schema commitTs

答案是否定的。在前面 F1 Online Schema 機制的描述中，我們可以看到在 add column DDL 的場景下，當服務層節(jié)點處于 write-only 狀態(tài)時，節(jié)點已經(jīng)能夠插入 new column data 了，但是此時 new column 還沒有處于用戶可見的狀態(tài)，也就是出現(xiàn)了 New data commitTs < New schema commitTs，或者說上述結(jié)論變成了：

New data commitTs > New schema(write-only) commitTs

但是由于在 delete-only + write-only 過渡狀態(tài)下，TiCDC 直接使用 New schema(write-only) 作為解析的 schema，可能導致 delete-only 節(jié)點 insert 的數(shù)據(jù)無法找到對應的 column 元信息或者元信息類型不匹配，導致數(shù)據(jù)丟失。所以為了保證數(shù)據(jù)正確解析，可能需要根據(jù)不同的 DDL 類型和具體的 TiDB 內(nèi)部實現(xiàn)，在內(nèi)部維護復雜的 schema 策略。

在當前 TiCDC 實現(xiàn)中，選擇了比較簡單的 schema 策略，直接忽略了各個中間狀態(tài)，只使用變更完成之后的 schema 狀態(tài)。為了更好表述在 TIDB Online DDL 機制下，當前 TiCDC 需要處理的不同場景，我們使用象限圖進行進一步歸類描述。

1 對應 old schema 狀態(tài)
此時 old schema data 和 old schema 是對應的*；*
4 對應 new schema public 及之后
此時 new schema data 和 new schema 是對應的；
3 對應 write-only ~ public 之間數(shù)據(jù)

此時 TiCDC 使用 old schema 解析數(shù)據(jù)，但是處于 write-only 狀態(tài)的 TiDB 節(jié)點已經(jīng)可以基于 new schema insert/update/delete 部分數(shù)據(jù)，所以 TiCDC 會收到 new schema data。不同 DDL 處理效果不同，我們選取 3 個常見有代表性的 DDL 舉例。

add column：狀態(tài)變更 absent -> delete-only -> write-only -> write-reorg -> public。由于 new schema data 是 TiDB 節(jié)點在 write-only 狀態(tài)下填充的默認值，所以使用 old schema 解析后會被直接丟棄，下游執(zhí)行 new schema DDL 的時候會再次填充默認值。對于動態(tài)生成的數(shù)據(jù)類型，比如 auto_increment 和 current timestamp，可能會導致上下游數(shù)據(jù)不一致。
change column：有損狀態(tài)變更 absent -> delete-only -> write-only -> write-reorg -> public, 比如 int 轉(zhuǎn) double，編碼方式不同需要數(shù)據(jù)重做。在 TiDB 實現(xiàn)中，有損 modify column 會生成不可見 new column，中間狀態(tài)下會同時變更新舊 column。對于 TiCDC 而言，只會處理 old column 下發(fā)，然后在下游執(zhí)行 change column，這個和 TiDB 的處理邏輯保持一致。
drop column：狀態(tài)變更 absent-> write-only -> delete-only -> delete-reorg -> public。write-only 狀態(tài)下新插入的數(shù)據(jù)已經(jīng)沒有了對應的 column，TiCDC 會填充默認值然后下發(fā)到下游，下游執(zhí)行 drop column 之后會丟棄掉該列。用戶可能看到預期外的默認值，但是數(shù)據(jù)能滿足最終一致性。

2 對應直接從 old schema -> new schema
說明這類 schema 變更下，old schema 和 new schema 是可以共存的，不需要中間狀態(tài)，比如 truncate table DDL。TiDB 執(zhí)行 truncate table 成功后，服務層節(jié)點可能還沒有加載 new schema，還可以往表中插入數(shù)據(jù)，這些數(shù)據(jù)會被 TiCDC 直接根據(jù) tableid 過濾掉，最終上下游都是沒有這個表存在的，滿足最終一致性。

總結(jié)

TiCDC 作為 TiDB 的數(shù)據(jù)同步組件，數(shù)據(jù)解析正確性問題是保證上下游數(shù)據(jù)一致性的核心問題。為了能充分理解 TiCDC 處理 data 和 schema 過程中遇到的各種異常場景，本文首先從 F1 Online Schema Change 原理出發(fā)，詳細描述在 schema 變更各個階段的數(shù)據(jù)行為，然后簡單描述了當前 TiDB Online DDL 的實現(xiàn)。最后引出在當前 TiCDC 實現(xiàn)下在 data 和 schema 處理關系上的討論。

??Tip：上文標藍部分均有跳轉(zhuǎn)，由于微信外鏈限制，大家可以點擊尾部【閱讀原文】查看原文～

国产秋霞理论久久久电影-婷婷色九月综合激情丁香-欧美在线观看乱妇视频-精品国avA久久久久久久-国产乱码精品一区二区三区亚洲人-欧美熟妇一区二区三区蜜桃视频

TiDB 應用 | TiDB Online DDL 在 TiCDC 中的應用