DPU產(chǎn)業(yè)現(xiàn)狀與競(jìng)爭(zhēng)格局


DPU的典型應(yīng)用場(chǎng)景包括:數(shù)據(jù)中心和云計(jì)算,網(wǎng)絡(luò)安全,高性能計(jì)算及AI,通信及邊緣計(jì)算,數(shù)據(jù)存儲(chǔ),流媒體等。
本內(nèi)容來(lái)自《2021中國(guó)DPU行業(yè)發(fā)展白皮書(shū)》。內(nèi)容共分4章:包括智能網(wǎng)卡的簡(jiǎn)介及趨勢(shì)分析、DPU的簡(jiǎn)介及分析、DPU產(chǎn)業(yè)分析及NVIDIA的DPU前景展望等。
1)在數(shù)據(jù)中心和云計(jì)算應(yīng)用中,DPU可廣泛應(yīng)用在物理機(jī)、虛擬化、容器化、私有云、公共云、混合云等各個(gè)方面。如OVS等Hypervisor、各種容器框架可以運(yùn)行在DPU上,實(shí)現(xiàn)控制平面和業(yè)務(wù)的分離,保障業(yè)務(wù)安全性;如DPU為SDN和虛擬化應(yīng)用提供硬件加速,大規(guī)模數(shù)據(jù)中心中,將本在CPU上運(yùn)行的通信和虛擬化操作卸載到DPU上,為用戶(hù)提供應(yīng)用加速即服務(wù)的附加價(jià)值。
2)在網(wǎng)絡(luò)安全中,DPU可應(yīng)用在分布式安全、下一代防火墻技術(shù)(NGFW)、微分段技術(shù)等方面。如DPU可以將一些安全相關(guān)的業(yè)務(wù)操作從CPU卸載到網(wǎng)卡,如數(shù)據(jù)的加密/解密(如IPSec、TLS等)操作、深度包檢測(cè)(DPI)等,大幅提升應(yīng)用的性能,降低CPU負(fù)載,并且支持靈活的網(wǎng)絡(luò)可編程性。
3)在高性能計(jì)算及AI中,DPU可應(yīng)用在云原生超級(jí)計(jì)算,深度學(xué)習(xí)推薦系統(tǒng)加速等方面。如DPU和配合NIVDIA Merlin處理深度學(xué)習(xí)推薦系統(tǒng)加速任務(wù),極大的提升產(chǎn)品數(shù)據(jù)處理與運(yùn)行效率,幫助用戶(hù)實(shí)現(xiàn)更為快速的產(chǎn)品開(kāi)發(fā)和迭代。
4)在通信及邊緣計(jì)算中,DPU可應(yīng)用在電信云、邊緣計(jì)算等方面。
5)在數(shù)據(jù)存儲(chǔ)中,DPU可應(yīng)用在超融合架構(gòu)(HCI)、彈性塊存儲(chǔ)、實(shí)例存儲(chǔ)等方面。
6)在流媒體中,DPU可應(yīng)用在視覺(jué)高品質(zhì),8K視頻,內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)等方面。
目前DPU市場(chǎng)仍處于藍(lán)海,呈現(xiàn)百家爭(zhēng)鳴的競(jìng)爭(zhēng)格局。Intel、NVIDIA等企業(yè)紛紛布局DPU產(chǎn)業(yè),同時(shí)包括AWS、阿里巴巴、華為在內(nèi)的各大云服務(wù)商,都已經(jīng)在布局自己的云端處理器,行業(yè)競(jìng)爭(zhēng)格局分析如下:


DPU方案類(lèi)型大致可以概括為三種:
一是以通用眾核處理器為基礎(chǔ)DPU,例如Broadcom的Stingray架構(gòu),以多核ARM為核心,以眾取勝,可編程靈活性較好,但是應(yīng)用針對(duì)性不夠,對(duì)于特殊算法和應(yīng)用的支持,與通用CPU相比并無(wú)太顯著優(yōu)勢(shì);
二是以專(zhuān)用核為基礎(chǔ)的異構(gòu)核陣列,這種架構(gòu)的特點(diǎn)是針對(duì)性較強(qiáng)、性能較好,但是犧牲了部分靈活性,如IPU;
第三種路線是結(jié)合了前面二者優(yōu)勢(shì),即將通用處理器的可編程靈活性與專(zhuān)用的加速引擎相結(jié)合,正在成為最新的產(chǎn)品趨勢(shì),以NVIDIA的BlueField-3系列DPU來(lái)看,就包括16個(gè)ARM核及多個(gè)專(zhuān)用加速引擎,F(xiàn)ungible的DPU則包含6大類(lèi)的專(zhuān)用核,和52個(gè)MIPS小型通用核。
隨著DPU將數(shù)據(jù)中心的基礎(chǔ)設(shè)施操作從CPU上卸載過(guò)來(lái),數(shù)據(jù)中心將形成DPU、GPU、CPU三位一體的狀態(tài);NVIDIA通過(guò)收購(gòu)Mellanox積極布局DPU,搶占市場(chǎng),憑借在GPU的絕對(duì)優(yōu)勢(shì)以及未來(lái)DPU的發(fā)力,NVIDIA有望在服務(wù)器處理器三大芯片中占據(jù)其二。對(duì)各廠商及現(xiàn)有產(chǎn)品分別綜述如下:
在技術(shù)路線上,英偉達(dá)DPU基于所收購(gòu)的Mellanox網(wǎng)絡(luò)方案及ARM架構(gòu)實(shí)現(xiàn),側(cè)重于數(shù)據(jù)安全、網(wǎng)絡(luò)、存儲(chǔ)卸載。
在2021年6月15日的Six Five峰會(huì)上,英特爾推出了全新的基礎(chǔ)設(shè)施處理器(IPU,全稱(chēng)Infrastructure Processing Unit)。IPU是一個(gè)網(wǎng)絡(luò)設(shè)備,可以安全地加速和管理數(shù)據(jù)中心的基礎(chǔ)設(shè)施功能與可編程硬件,旨在使云和通信服務(wù)提供商減少在中央處理器方面的開(kāi)銷(xiāo),并充分釋放性能價(jià)值。利用IPU,客戶(hù)能夠部署安全穩(wěn)定且可編程的解決方案,從而更好地利用資源,平衡數(shù)據(jù)處理與存儲(chǔ)的工作負(fù)載。IPU可將CPU或xPU連接到網(wǎng)絡(luò),加速主機(jī)基礎(chǔ)設(shè)施功能,并適用于現(xiàn)有和新興基礎(chǔ)設(shè)施用例,包括安全性、虛擬化、存儲(chǔ)、負(fù)載平衡,以及虛擬網(wǎng)絡(luò)功能和微服務(wù)的數(shù)據(jù)路徑優(yōu)化。IPU增強(qiáng)了基礎(chǔ)NIC中豐富的以太網(wǎng)網(wǎng)絡(luò)功能,通過(guò)高度優(yōu)化的硬件加速器和緊密耦合的計(jì)算引擎的組合處理任務(wù)來(lái)實(shí)現(xiàn)加速。適應(yīng)性是通過(guò)標(biāo)準(zhǔn)且易于使用的編程框架實(shí)現(xiàn)的,該框架結(jié)合了硬件和軟件功能。IPU擴(kuò)展了英特爾的智能網(wǎng)卡功能,旨在應(yīng)對(duì)當(dāng)下復(fù)雜的數(shù)據(jù)中心,并提升效率。
憑借在數(shù)據(jù)中心領(lǐng)域多年的耕耘與積淀,深諳數(shù)據(jù)中心企業(yè)需求并洞察行業(yè)發(fā)展的英特爾,IPU產(chǎn)品從設(shè)計(jì)、生產(chǎn)到推出,每一步都能看到合作伙伴的身影。當(dāng)前基于Intel FPGA的IPU已經(jīng)導(dǎo)入多個(gè)云端服務(wù)商,目前也著手測(cè)試第一款采用ASIC的IPU產(chǎn)品;
Intel也強(qiáng)調(diào)接下來(lái)將會(huì)推出更多基于FPGA的IPU與專(zhuān)用ASIC,為新世代資料中心帶來(lái)更具彈性、安全與效率的XPU架構(gòu)。在適用于企業(yè)和云的IPU陣營(yíng),使用英特爾FPGA實(shí)現(xiàn)數(shù)據(jù)中心加速面向云服務(wù)提供商的采用英特爾FPGA的IPU有助于充分利用網(wǎng)絡(luò)功能并幫助提高基礎(chǔ)設(shè)施投資的收入;英特爾IPU為VMware下一代基礎(chǔ)架構(gòu)提供動(dòng)力英特爾技術(shù)使VMware能夠?yàn)榭?/span>戶(hù)提供對(duì)虛擬機(jī)、容器和裸機(jī)環(huán)境的統(tǒng)一管理;Monterey項(xiàng)目則重新定義混合云架構(gòu),英特爾IPU創(chuàng)新為邊緣節(jié)點(diǎn)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施和數(shù)據(jù)中心計(jì)算提供了更高的性能。
Xilinx的開(kāi)發(fā)是基于FPGA的Smart NIC,Xilinx于2019年秋季收購(gòu)了Solarflare Communications,Solarflare自2012年以來(lái)一直在構(gòu)建基于ASIC和FPGA的NIC進(jìn)行電子交易。
Xilinx的Alveo U25將雙SFP28端口直接連接到Zynq系列芯片,包括6GB DDR4內(nèi)存,Zynq的FPGA和ARM內(nèi)核可通過(guò)該芯片上運(yùn)行的程序?qū)ζ溥M(jìn)行訪問(wèn)。FPGA有520K邏輯元件可用,但是提供的四核ARM可以彌補(bǔ)可用門(mén)數(shù)的減少。Xilinx將Alveo U25推向市場(chǎng),最初是針對(duì)那些要求開(kāi)放虛擬交換機(jī)(OvS)卸載功能的客戶(hù)。其將增加IPsec、機(jī)器學(xué)習(xí)(ML)、深度包檢查(DPI)、視頻轉(zhuǎn)碼和分析等功能的卸載。
Marvell最新推出的OCTEON 10系列DPU采用了臺(tái)積電5nm制程工藝,且首次用上了ARM的Neoverse N2 CPU內(nèi)核。這種類(lèi)型的多功能芯片,旨在幫助移動(dòng)和處理那些通過(guò)網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù),可實(shí)現(xiàn)集成機(jī)器學(xué)習(xí)推理的引擎、Inline加密處理引擎、以及矢量數(shù)據(jù)包處理器等的虛擬化。OCTEON 10也是Marvell首款采用臺(tái)積電N5P工藝制造的DPU芯片。其不僅率先集成了ARM的Neoverse N2 CPU核心,還支持最新的PCIe 5.0 I/O與DDR5內(nèi)存。

受益于最新的ARM處理器內(nèi)核,OCTEON 10在整型處理上是目前算力最高的DPU,然而其浮點(diǎn)運(yùn)算僅支持FP16,在做內(nèi)聯(lián)機(jī)器學(xué)習(xí)時(shí)有一定局限性。OCTEON 10 新系列引入了矢量數(shù)據(jù)包處理引擎(VPP),與當(dāng)前一代的標(biāo)量處理引擎相比,它能夠?qū)?shù)據(jù)包的處理吞吐量,大幅提升至 5 倍。
中科馭數(shù)的創(chuàng)始團(tuán)隊(duì)主要來(lái)自中科院計(jì)算所計(jì)算機(jī)體系結(jié)構(gòu)國(guó)家重點(diǎn)實(shí)驗(yàn)室,是中國(guó)最早進(jìn)行DPU芯片研發(fā)的團(tuán)隊(duì)之一。中科馭數(shù)提出了軟件定義加速器技術(shù)(Software Defined Accelerator),自主研發(fā)了KPU(Kernel Processing Unit)芯片架構(gòu),并于2019年設(shè)計(jì)出業(yè)界首顆數(shù)據(jù)庫(kù)與時(shí)序數(shù)據(jù)處理融合加速芯片,已經(jīng)成功流片。中科馭數(shù)的DPU芯片,正是基于自研的KPU芯片架構(gòu),具有網(wǎng)絡(luò)協(xié)議處理、數(shù)據(jù)庫(kù)和大數(shù)據(jù)處理加速、存儲(chǔ)運(yùn)算、安全加密運(yùn)算等核心功能。
DPU發(fā)展仍在早期,強(qiáng)調(diào)落地和生態(tài)打造。數(shù)據(jù)中心核心算力芯片仍以CPU、GPU、FPGA和少量ASIC為主,并且通用CPU還是占據(jù)絕對(duì)統(tǒng)治地位。和CPU、GPU一樣,DPU作為基礎(chǔ)層的應(yīng)用支撐,發(fā)展的關(guān)鍵是必須重視生態(tài)建設(shè)和應(yīng)用支撐,落地并搶占市場(chǎng)、營(yíng)造生態(tài)才是DPU產(chǎn)業(yè)發(fā)展的關(guān)鍵所在。
Intel、Marvell、NVIDIA成為最有潛力的產(chǎn)業(yè)先驅(qū)。大多數(shù)DPU方案是從基本的網(wǎng)絡(luò)控制器開(kāi)始擴(kuò)展至SoC。就Intel而言,其產(chǎn)品采取處理器配合FPGA,外加加速引擎的方式;Marvell則采取使用最新處理器內(nèi)核配合加速引擎的方式;NVIDIA則采用了處理器配合ASIC,外加加速引擎的方式。這三種方式代表著DPU產(chǎn)業(yè)的未來(lái)主流的發(fā)展方向。
(2)中國(guó)DPU產(chǎn)業(yè)發(fā)展現(xiàn)狀
中國(guó)DPU產(chǎn)業(yè)處于起步階段,自DPU概念出現(xiàn)以來(lái),已有多家國(guó)內(nèi)公司進(jìn)入該領(lǐng)域。
從中國(guó)國(guó)內(nèi)市場(chǎng)需求側(cè)來(lái)看,中國(guó)擁有世界最強(qiáng)的互聯(lián)網(wǎng)產(chǎn)業(yè)、規(guī)模最大的網(wǎng)民和線上生態(tài),正是因?yàn)閿?shù)據(jù)的大爆發(fā),推動(dòng)了對(duì)算力的需求,同時(shí),中國(guó)愈加重視網(wǎng)絡(luò)安全,DPU在確保網(wǎng)絡(luò)安全方向有得天獨(dú)厚的優(yōu)勢(shì),從數(shù)據(jù)安全到數(shù)據(jù)中心安全皆全方面覆蓋,從而具備較好的發(fā)展?jié)摿?,這是DPU發(fā)展的前提。DPU將致力于解決“網(wǎng)絡(luò)協(xié)議處理、數(shù)據(jù)安全、算法加速”等問(wèn)題,而這些問(wèn)題有著“CPU做不好,GPU做不了”的特點(diǎn)。數(shù)據(jù)中心與云計(jì)算領(lǐng)域是中國(guó)DPU最大的應(yīng)用市場(chǎng),DPU可為終端政企用戶(hù)提供較為成熟的安全的軟件定義及硬件加速解決方案。

得益于智能網(wǎng)卡方案的逐步成熟,疊加全球通用服務(wù)器出貨量的穩(wěn)定增長(zhǎng)、L3以上級(jí)別智能駕駛汽車(chē)的技術(shù)落地、工業(yè)控制領(lǐng)域的需求增加、邊緣計(jì)算技術(shù)和物聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,全球DPU產(chǎn)業(yè)市場(chǎng)規(guī)模呈現(xiàn)逐年增長(zhǎng)的趨勢(shì),并隨著Intel、NVIDIA等廠商的DPU大規(guī)模量產(chǎn),預(yù)計(jì)DPU市場(chǎng)將在2023-2024年迎來(lái)爆發(fā)式增長(zhǎng)。2020年全球DPU產(chǎn)業(yè)市場(chǎng)規(guī)模達(dá)30.5億美元,預(yù)計(jì)到2025年全球DPU產(chǎn)業(yè)市場(chǎng)規(guī)模將超過(guò)245.3億美元。

得益于數(shù)據(jù)中心升級(jí)和邊緣計(jì)算、新能源汽車(chē)、IoT、工業(yè)物聯(lián)網(wǎng)等產(chǎn)業(yè)的發(fā)展所帶來(lái)的需求增長(zhǎng),中國(guó)DPU產(chǎn)業(yè)市場(chǎng)規(guī)模呈現(xiàn)逐年增長(zhǎng)的趨勢(shì),預(yù)計(jì)中國(guó)DPU市場(chǎng)將在2022-2023年迎來(lái)爆發(fā)式增長(zhǎng),并在2024-2025年保持平穩(wěn)。2020年中國(guó)DPU產(chǎn)業(yè)市場(chǎng)規(guī)模達(dá)3.9億元,預(yù)計(jì)到2025年中國(guó)DPU產(chǎn)業(yè)市場(chǎng)規(guī)模將超過(guò)565.9億元。
更多DPU行業(yè)分析,請(qǐng)參閱白皮書(shū)《2021中國(guó)DPU行業(yè)發(fā)展白皮書(shū)》。本白皮書(shū)內(nèi)容共分4章內(nèi)容,包括智能網(wǎng)卡的簡(jiǎn)介及趨勢(shì)分析、DPU的簡(jiǎn)介及分析、DPU產(chǎn)業(yè)分析及NVIDIA的DPU前景展望等。
來(lái)源:DPU產(chǎn)業(yè)現(xiàn)狀與競(jìng)爭(zhēng)格局

轉(zhuǎn)載申明:轉(zhuǎn)載本號(hào)文章請(qǐng)注明作者和來(lái)源,本號(hào)發(fā)布文章若存在版權(quán)等問(wèn)題,請(qǐng)留言聯(lián)系處理,謝謝。
推薦閱讀
更多架構(gòu)相關(guān)技術(shù)知識(shí)總結(jié)請(qǐng)參考“架構(gòu)師全店鋪技術(shù)資料打包”相關(guān)電子書(shū)(37本技術(shù)資料打包匯總詳情可通過(guò)“閱讀原文”獲取)。
全店內(nèi)容持續(xù)更新,現(xiàn)下單“全店鋪技術(shù)資料打包(全)”,后續(xù)可享全店內(nèi)容更新“免費(fèi)”贈(zèng)閱,價(jià)格僅收198元(原總價(jià)350元)。
溫馨提示:
掃描二維碼關(guān)注公眾號(hào),點(diǎn)擊閱讀原文鏈接獲取“架構(gòu)師技術(shù)全店資料打包匯總(全)”電子書(shū)資料詳情。

