1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        DistributedLog分布式高性能日志復(fù)制服務(wù)

        聯(lián)合創(chuàng)作 · 2023-09-30 00:14

        DL是一個高性能的日志復(fù)制服務(wù),提供了持久化、復(fù)制以及強一致性的功能,這對于構(gòu)建可靠的分布式系統(tǒng)都是至關(guān)重要的,如復(fù)制狀態(tài)機(replicated-state-machines)、通用的發(fā)布/訂閱系統(tǒng)、分布式數(shù)據(jù)庫以及分布式隊列。

        DistributedLog會分類維護記錄的序列(sequences of records),并將其稱為Log(又叫做Log Stream),將記錄寫入到DL Log的進程稱之為Writer,從Log中讀取并處理記錄的進程稱之為Reader。因此,它整體的軟件棧如下所示:

        具體來講,它包含如下幾個組成部分:

        Log

        Log是有序的、不可變的日志記錄(log record),它的數(shù)據(jù)結(jié)構(gòu)如下所示:

        日志記錄

        每條日志記錄都是一個字節(jié)序列。日志記錄會按照序列寫入到日志流中,并且會分配一個名為DLSN(分布式序列號,DistributedLog Sequence Number)的唯一序列號。除了DLSN以外,應(yīng)用程序還可以在構(gòu)建日志記錄的時候設(shè)置自己的序列號,應(yīng)用程序所定義的序列號稱為TransactionID(txid)。不管是DLSN還是TransactionID都能用來定位Reader,使其從特定的日志記錄開始讀取。

        Log分段(Log Segments)

        Log會被分解為Log分段,每個分段中包含了其記錄的子集。Log分段是分布式的,應(yīng)該放到Log分段存儲中(如BookKeeper)。DistributedLog會基于配置好的策略來輪詢每個Log分段,要么是可配置的時間段(如每兩個小時),要么是可配置的最大規(guī)模(如每128MB)。所以Log的數(shù)據(jù)將會分為同等大小的Log分段,并且均勻分布到Log分段存儲節(jié)點上。這樣,Log的存儲就不會局限于單臺服務(wù)器的限制,同時,能夠在集群中分散讀取的流量。

        Log的數(shù)據(jù)可以永遠保存,直到應(yīng)用程序顯式地將其截斷,也可以在一個可配置的時間段內(nèi)保存。對于構(gòu)建復(fù)制狀態(tài)機來說,顯式截斷會非常有用,如分布式數(shù)據(jù)庫。在數(shù)據(jù)何時能夠截斷這一點上,它們往往有著嚴格的控制?;跁r間保留Log對于實時分析的場景更為有用,它們只關(guān)心一定時間內(nèi)的數(shù)據(jù)。

        命名空間

        屬于同一組織的Log流通常會歸類在同一個命名空間(namespace)下,并據(jù)此進行管理。DL的命名空間基本上就是用來定位Log流在何處的。應(yīng)用程序可以在某個命名空間下創(chuàng)建和刪除流,也能將某個流截斷到給定的序列號上(DLSN或TransactionID均可以)。

        Writer

        Writer會將數(shù)據(jù)寫入到它們所選擇的Log中。所有的記錄都會按照順序添加到Log之中。序列號是由Writer所負責(zé)的,這就意味著對于某個Log,在給定的時間點上,只能有一個激活的Writer。當(dāng)出現(xiàn)網(wǎng)絡(luò)分區(qū)(network partition),導(dǎo)致兩個Writer試圖往同一個Log進行寫入的時候,DL會保證其正確性,這是通過Log分段存儲的屏障(fencing)來實現(xiàn)的。

        Writer由名為Write Proxy的服務(wù)層來提供和管理,Write Proxy用來接受大量客戶端的fan-in寫入。

        Reader

        Reader會從它們所選擇的Log中讀取記錄,這會在一個給定的位置開始。這個給定的位置可以是DLSN,也可以是TransactionID。Reader將會嚴格按照Log的順序讀取記錄。在同一個Log中,不同的Reader可以在不同的起始位置讀取記錄。

        與其他的訂閱/發(fā)布系統(tǒng)不同,DistributedLog并不會記錄/管理Reader的位置,它將跟蹤的任務(wù)留給了應(yīng)用程序本身,因為不同的應(yīng)用在跟蹤和協(xié)調(diào)位置上可能會有不同的需求,很難用一種方式就將這些需求全部解決。在應(yīng)用程序?qū)用?,借助各種存儲(如ZooKeeper、FileSystem或Key/Value存儲)能夠很容易地跟蹤Reader的位置。

        Log記錄可以緩存在名為Read Proxy的服務(wù)層中,從而應(yīng)對大量Reader的讀取。

        Fan-in與Fan-out

        DistributedLog的核心支持單Writer、多Reader的語義。服務(wù)層構(gòu)建在DistributedLog Core之上,支持大量的Writer和Reader。服務(wù)層包含Write Proxy和Read Proxy,Write Proxy管理Log的Writer,并且在機器宕機時,能夠?qū)λ鼈冞M行故障恢復(fù)。它能夠從眾多來源聚集Writer,允許不必關(guān)心Log的所有權(quán)(又稱為Fan-in)。Read Proxy通過將記錄放到緩存中,優(yōu)化了Reader的讀取路徑,以應(yīng)對成百上千的Reader讀取同一個Log流的狀況。

        作為一個日志服務(wù),DistributedLog的優(yōu)勢可以總結(jié)為:

        • 高性能:面對大量的并發(fā)日志時,在可持久化的Writer上DL能夠提供毫秒級的延遲,同時還能應(yīng)對上千客戶端每秒大量的讀取和寫入操作。

        • 持久化和一致性:消息會持久化到磁盤上,并且以副本的形式存儲多份,從而避免丟失。通過嚴格的順序,保證Writer和Reader之間的一致性。

        • 各種工作負載:DL支持各種負載,包括延遲敏感的在線事務(wù)處理(OLTP)應(yīng)用(如分布式數(shù)據(jù)庫的WAL和基于內(nèi)存的復(fù)制狀態(tài)機)、實時的流提取和計算以及分析處理。

        • 多租戶:針對實際的工作負載,DL的設(shè)計是I/O隔離的,從而支持多租戶的大規(guī)模日志。

        • 分層架構(gòu):DL有一個現(xiàn)代化的分層設(shè)計,它將有狀態(tài)的存儲層與無狀態(tài)的服務(wù)提供層進行了分離,能夠使存儲的擴展獨立于CPU和內(nèi)存,因此支持大規(guī)模的寫入fan-in和讀取fan-out。

        瀏覽 34
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        編輯 分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        編輯 分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            日韩欧美午夜成人无码 | 91干在线 | 蜜乳AV一区二区三区 | 欧美丰满熟妇BBBBBB小短人 | xxnx国产麻豆 | a在线观看| 免费婷婷 | 色婷婷中文在线 | 黄片在线视频 | 人人舔|