1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        CCIX緩存一致性互聯(lián)技術(shù)概述

        共 4028字,需瀏覽 9分鐘

         ·

        2021-12-18 03:41



        緩存一致性的加速器互聯(lián),即 CCIX?(讀成“see 6”)是一種能夠?qū)蓚€(gè)或兩個(gè)以上器件通過緩存一致性的方式來共享數(shù)據(jù)的片間互聯(lián)。機(jī)器學(xué)習(xí)和大數(shù)據(jù)應(yīng)用正深刻的變革數(shù)據(jù)處理的方式。通過片外加速器的定制,傳統(tǒng)處理器從計(jì)算到網(wǎng)絡(luò)的應(yīng)用都得到了增強(qiáng);這推動(dòng)了產(chǎn)業(yè)整體向加速器和異構(gòu)計(jì)算發(fā)展。對(duì)目前很多計(jì)算任務(wù),加速器能夠比單獨(dú)的處理器速度更 快、功耗更低的完成所需功能。


        下載鏈接:

        CCIX緩存一致性互聯(lián)技術(shù)概述

        ARM CPU處理器資料匯總(1)

        ARM CPU處理器資料匯總(2)


        加速的挑戰(zhàn)?

        今天,高科技的版圖是由新的、大規(guī)模的消費(fèi)者服務(wù)的創(chuàng)新構(gòu)成的,例如 5G、云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)和自動(dòng)駕駛。機(jī)器學(xué) 習(xí)和人工智能應(yīng)用根本性的改變了消費(fèi)者行為。這又推進(jìn)了平臺(tái)和解決方案不斷演進(jìn),通過高效、可擴(kuò)展的方式來支持這些新應(yīng)用。僅以中央處理器為中心的服務(wù)器架構(gòu)的解決方案無法滿足這些應(yīng)用的性能需求。因此需要基于高效的異構(gòu)計(jì)算架構(gòu)的解決方案,包含加速器例如圖形處理單元(GPU)、可編程邏 輯陣列(FGPA)、智能網(wǎng)卡(NIC)和很多其它領(lǐng)域特定的可編程器件。PCI Express? (PCIe?) 是目前最常見的,處理器和片外加速器間傳輸數(shù)據(jù)的協(xié)議。盡管 PCIe 協(xié)議作為輸入輸出(IO)協(xié)議很有效,但不能支持 IO 設(shè)備成為對(duì)等計(jì)算模型中的一 個(gè)無縫組件。隨著片外加速器的應(yīng)用越來越多,高性能、低延時(shí)和易用性成 為下一代互聯(lián)的首要訴求。


        CCIX 優(yōu)勢(shì)?

        高性能、低延時(shí)的片間互聯(lián)接口是任何基于片外加速器的系統(tǒng)的關(guān)鍵部分。產(chǎn)業(yè)成功的很重要的一點(diǎn)是,處理器、加速器和其它外設(shè)的廠商能獲得一個(gè)非私有的標(biāo)準(zhǔn)來保證片間的無縫傳輸。這樣一個(gè)標(biāo)準(zhǔn)的強(qiáng)烈訴求促成了 CCIX 聯(lián)盟的成立,CCIX聯(lián)盟由一群有共同理念、希望解決片外加速器互聯(lián)需求的公司組成。通過變革加速器的內(nèi)存和數(shù)據(jù)移動(dòng)的方式,這個(gè)新的互聯(lián)標(biāo)準(zhǔn)對(duì)使能下一代平臺(tái)和解決方案起到關(guān)鍵作用。


        CCIX 采用兩種機(jī)制來提高性能、降低延時(shí)。第一種機(jī)制是采用緩存一致性,自動(dòng)保持處理器和加速器的緩存一致,提升易用性、降低延時(shí)。第二種機(jī)制是提高 CCIX 鏈接的原始帶寬。最高鏈接速率升至 25GT/s (千兆傳輸/秒)。CCIX 規(guī)范也規(guī)定了多個(gè)CCIX 端口如何聚合提供超過單個(gè)接口的性能,匹配加速器和內(nèi)存擴(kuò)展帶寬。


        緩存一致性和共享虛擬內(nèi)存?

        多處理器系統(tǒng)已經(jīng)部署了確保不同處理器緩存一致性的技術(shù)。將現(xiàn)有緩存一致性互聯(lián)的基本原理擴(kuò)展到加速器,應(yīng)用數(shù)據(jù)就可以在處理器緩存和加速器緩存間自主傳遞,不需要軟件驅(qū)動(dòng)參與數(shù)據(jù)傳遞。除了緩存,CCIX 還支持操作系統(tǒng)分頁(yè)的內(nèi)存(系統(tǒng)內(nèi)存)擴(kuò)展包含 PCIe 設(shè)備帶的內(nèi)存。CCIX 的數(shù)據(jù)共享模型是基于以虛擬地址(VA)尋址的共享內(nèi)存。



        處理器和加速器的緩存和/或內(nèi)存通過 CCIX協(xié)議自動(dòng)更新。因?yàn)閿?shù)據(jù)通過 CCIX 協(xié)議自動(dòng)同步,只需要傳遞數(shù)據(jù)指針而不需依賴復(fù)雜的直接內(nèi)存訪問(DMA)驅(qū)動(dòng)。自動(dòng)同步能減小數(shù)據(jù)延時(shí),提升應(yīng)用性能。同時(shí)減小了軟件開發(fā)者的負(fù)擔(dān),使他們聚焦于應(yīng)用而不是加速器和主處理器間數(shù)據(jù)傳遞的底層機(jī)制。



        CCIX 分層架構(gòu)?

        CCIX 架構(gòu)是從 PCI Express 基本架構(gòu)擴(kuò)展的分層架構(gòu)。一般來看,CCIX 可看作兩個(gè)主要規(guī)范,包含各層級(jí)協(xié)議。CCIX 協(xié)議規(guī)范包含 CCIX 協(xié)議層和 CCIX 鏈接層。這些層規(guī)定緩存一致性協(xié)議、報(bào)文發(fā)送、流控和 CCIX 傳輸部分的協(xié)議。CCIX 傳輸規(guī)范包含 CCIX 和 PCIe 事務(wù)層,PCIe 數(shù)據(jù)鏈路層,和 CCIX 物理層。這些層負(fù)責(zé)器件間的物理連接,包括速率和帶寬協(xié)商,傳輸包錯(cuò)誤檢測(cè)和重試,和初始包編碼協(xié)議。



        CCIX 協(xié)議層

        CCIX 棧的最上層是 CCIX 協(xié)議層。這一層負(fù)責(zé)一致性協(xié)議,包括內(nèi)存的讀、寫流。這一層提供了片上一致性協(xié)議(例如 Arm AMBA CHI)的簡(jiǎn)單映射。這一層定義的緩存狀態(tài)使得硬件能夠確定內(nèi)存的狀態(tài)。比如硬件可以確定數(shù)據(jù)是否唯一且未被修改(和內(nèi)存一致),或是共享且被修改的(和內(nèi)存不一致)。


        CCIX 鏈接層?

        CCIX 協(xié)議層之下是 CCIX 鏈接層。這一層負(fù)責(zé) CCIX 協(xié)議層定義的代理(agent)之間消息的傳輸格式。目前 CCIX 鏈接層是構(gòu)建在 PCIe 之上,但是基于分層架構(gòu),CCIX 將來可以映射到不同的傳輸層。此外,這一層負(fù)責(zé)端口聚合,使得多個(gè)端口能夠聚合在一起提升帶寬。


        CCIX 和 PCIe 事務(wù)層?

        CCIX 和 PCIe 事務(wù)層負(fù)責(zé)處理它們各自的包。PCIe 協(xié)議支持部署虛擬通道,使得不同數(shù)據(jù)流通過一個(gè) PCIe 鏈路。將 CCIX 和 PCIe 傳輸流各分到一個(gè)虛擬通道,CCIX 和PCIe 傳輸可以共享相同的鏈路。CCIX 能夠傳輸標(biāo)準(zhǔn)的 PCIe 包,或經(jīng)過優(yōu)化的 CCIX 包。經(jīng)過優(yōu)化的 CCIX 包刪減了 PCIe 包里的幾個(gè)不必要的字段。傳輸標(biāo)準(zhǔn)的 PCIe 包時(shí)可以采用現(xiàn)有的 PCIe 交換器。傳輸經(jīng)過優(yōu)化的 CCIX 包,能降低 PCIe 的額外開銷,使得一致性傳輸?shù)陌?、更高效?/span>


        PCIe 數(shù)據(jù)鏈路層?

        PCIe 數(shù)據(jù)鏈路層執(zhí)行數(shù)據(jù)鏈路層的所有正常功能。這些功能包括 CRC 錯(cuò)誤校驗(yàn)、包確認(rèn)和超時(shí)檢查,和信用初始化及交換。


        CCIX/PCIe 物理層?

        CCIX/PCIe 物理層的基礎(chǔ)是 PCIe 物理層。CCIX 擴(kuò)展了物理層來支持 25GT/S(千兆傳輸/秒)。這個(gè)較快的速率稱為 ESM(擴(kuò)展速率模式),會(huì)在兩個(gè)具備 ESM 模式的器件連接時(shí)自動(dòng)識(shí)別,速率比當(dāng)前的第四代 PCIe 速率 16GT/S提升 56%。


        CCIX 系統(tǒng)拓?fù)錁永?

        得益于分層架構(gòu),CCIX 能夠支持多種靈活的拓?fù)浣Y(jié)構(gòu)。最常見的拓?fù)浣Y(jié)構(gòu)是直接附加的共享虛擬內(nèi)存。但其它拓?fù)浣Y(jié)構(gòu),如交換器、菊花鏈或網(wǎng)狀拓?fù)洌埠苋菀妆粯?gòu)建和支持。



        CCIX 一致性分層架構(gòu)

        CCIX 協(xié)議定義了 CCIX 組成模塊的內(nèi)存訪問協(xié)議。所有 CCIX 器 件至少有一個(gè)具備 CCIX 鏈接的端口。一個(gè) CCIX 端口關(guān)聯(lián)一組物理管腳,用于和另一個(gè) CCIX 端口連接,在兩個(gè)或多個(gè)不同芯片間交互信息。


        同時(shí)定義了一些不同的代理類型,哪種代理在哪一個(gè)器件取決于器件的功能。定義的代理類型包括:請(qǐng)求代理(RA)、主代 理(HA)、從代理(SA)和錯(cuò)誤代理(Error Agent)。請(qǐng)求代理、主代理、從代理、錯(cuò)誤代理,系統(tǒng)里的端口和鏈接統(tǒng)稱CCIX 組件。一個(gè)代理在協(xié)議中由一個(gè)代理 ID 標(biāo)識(shí)。以下對(duì)每一種代理類型進(jìn)行簡(jiǎn)要描述。


        CCIX 數(shù)據(jù)流樣例?

        基于上述的代理類別,可以描述 CCIX 可見的一些常見用例。


        加速器共享處理器內(nèi)存:當(dāng)采用和部署 CCIX 時(shí),最常見的初始用例是處理器和加速器共享緩存。這個(gè)用例里有兩個(gè)請(qǐng)求代理,各自管理自己的緩存。主代理在處理器上,管理連接到該處理器的內(nèi)存的訪問。



        共享的處理器和加速器內(nèi)存:下一種常用模型可能是處理器和加速器共享虛擬內(nèi)存。在這個(gè)用例里,加速器和處理器的內(nèi)存同在一個(gè)共享虛擬內(nèi)存池里。處理器只需要簡(jiǎn)單的將待處理的數(shù)據(jù)的地址指針傳給加速器,而不需要復(fù)雜的 PCIe DMA 和驅(qū)動(dòng)在處理器和加速器內(nèi)存之間傳遞數(shù)據(jù)。有兩個(gè)請(qǐng)求代理管理各自的緩存,有兩個(gè)主代理管理內(nèi)存。免去軟件驅(qū)動(dòng)開發(fā)和額外開銷,可以大幅提升系統(tǒng)性能和簡(jiǎn)化軟件。



        拓展基本結(jié)構(gòu):得益于 CCIX 非常靈活的特性,它可以在展示的這些基本數(shù)據(jù)流之外進(jìn)行拓展。從直接附帶的加速器、到網(wǎng)狀拓?fù)浜托切途W(wǎng)絡(luò), CCIX 具備很可觀的選項(xiàng)來支持很多種類的拓?fù)浣Y(jié)構(gòu)。


        CCIX 聯(lián)盟是一個(gè)開放的工業(yè)標(biāo)準(zhǔn)組織,制定獨(dú)立于任何處理器架構(gòu)的、非私有的 CCIX 標(biāo)準(zhǔn)。CCIX 標(biāo)準(zhǔn)為內(nèi)存擴(kuò)展器件和加速器提供高性能、低延時(shí)、芯片與芯片間的互聯(lián)。它特別為應(yīng) 對(duì)未來數(shù)據(jù)中心、云計(jì)算、大數(shù)據(jù)及其它需要異構(gòu)計(jì)算的應(yīng)用的巨大挑戰(zhàn)而設(shè)計(jì)。CCIX 標(biāo)準(zhǔn)將是革命性的進(jìn)步,它拓展了開放、異構(gòu)架構(gòu)和緩存一致性共享內(nèi)存模型的優(yōu)勢(shì),來滿足未來數(shù)據(jù)中心不斷演進(jìn)的需求。


        下載鏈接:

        CCIX緩存一致性互聯(lián)技術(shù)概述

        ARM CPU處理器資料匯總(1)

        ARM CPU處理器資料匯總(2)

        ARM系列處理器應(yīng)用技術(shù)完全手冊(cè)

        相關(guān)下載:CPU和GPU研究框架合集
        1、行業(yè)深度報(bào)告:GPU研究框架

        2、信創(chuàng)產(chǎn)業(yè)研究框架

        3、ARM行業(yè)研究框架

        4、CPU研究框架

        5、國(guó)產(chǎn)CPU研究框架

        6、行業(yè)深度報(bào)告:GPU研究框架


        Arm架構(gòu)服務(wù)器的開源應(yīng)用

        Arm架構(gòu)服務(wù)器和存儲(chǔ)

        服務(wù)器硬件體系架構(gòu)淺析
        服務(wù)器市場(chǎng)現(xiàn)狀研究


        2021年信創(chuàng)產(chǎn)業(yè)發(fā)展報(bào)告

        2020信創(chuàng)發(fā)展研究報(bào)告

        信創(chuàng)研究框架

        信創(chuàng)產(chǎn)業(yè)系列專題(總篇)

        2021年中國(guó)信創(chuàng)生態(tài)研究報(bào)告

        中國(guó)信創(chuàng)產(chǎn)業(yè)發(fā)展白皮書(2021)


        異構(gòu)芯片研究框架合集

        1、EDA行業(yè)研究框架
        2、半導(dǎo)體大硅片研究框架
        3、封測(cè)行業(yè)研究框架
        4、光刻機(jī)行業(yè)研究框架
        4、國(guó)產(chǎn)FPGA研究框架
        5、國(guó)產(chǎn)基帶芯片研究框架
        6、深度報(bào)告:NOR存儲(chǔ)芯片研究框架


        本號(hào)資料全部上傳至知識(shí)星球,更多內(nèi)容請(qǐng)登錄智能計(jì)算芯知識(shí)(知識(shí)星球)星球下載全部資料。




        免責(zé)申明:本號(hào)聚焦相關(guān)技術(shù)分享,內(nèi)容觀點(diǎn)不代表本號(hào)立場(chǎng),可追溯內(nèi)容均注明來源,發(fā)布文章若存在版權(quán)等問題,請(qǐng)留言聯(lián)系刪除,謝謝。



        電子書<服務(wù)器基礎(chǔ)知識(shí)全解(終極版)>更新完畢,知識(shí)點(diǎn)深度講解,提供182頁(yè)完整版下載。

        獲取方式:點(diǎn)擊“閱讀原文”即可查看PPT可編輯版本和PDF閱讀版本詳情。



        溫馨提示:

        請(qǐng)搜索“AI_Architect”或“掃碼”關(guān)注公眾號(hào)實(shí)時(shí)掌握深度技術(shù)分享,點(diǎn)擊“閱讀原文”獲取更多原創(chuàng)技術(shù)干貨。


        瀏覽 305
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            视频爱爱免费视频爱爱太爽 | 国产操大逼视频 | 国产成人一级毛片 | 日本在线国产 | 国产高清一级毛片在线不卡 | 影音先锋AV电影 | 成人免费无码婬片 | 琪琪色在线观看 | 他的粗大在我体内进出好多水 | 男女做爰猛烈叫床直播 |