1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        2021年該如何選擇深度學(xué)習(xí)工具?這款數(shù)據(jù)科學(xué)工作站了解一下

        共 2909字,需瀏覽 6分鐘

         ·

        2021-06-08 15:27

        深度學(xué)習(xí)

        轉(zhuǎn)自:機(jī)器之心
        6 月 12 日機(jī)器之心 CVPR 2021 論文分享會(huì)上,惠普將展示一款強(qiáng)大的數(shù)據(jù)科學(xué)工作站。
        AI 研發(fā)者們想要找到一臺(tái)能夠穩(wěn)定跑深度學(xué)習(xí)算法的電腦,其實(shí)是一件有點(diǎn)挑戰(zhàn)性的事。

        DIY 是一個(gè)常見(jiàn)的思路,不過(guò)對(duì)于那些選擇自行搭建系統(tǒng)的人來(lái)說(shuō),從主板到電源一切細(xì)節(jié)都要慢慢學(xué)起,還經(jīng)常會(huì)遇到這樣那樣的問(wèn)題;同時(shí),如何保證各硬件都能協(xié)調(diào)運(yùn)行,達(dá)到所需的性能,也是一大難題;另一方面,在全球芯片短缺的當(dāng)下,要獲得一塊能滿足 AI 研發(fā)需求的顯卡也并非易事。在此基礎(chǔ)上,研發(fā)者還需要自己尋找或購(gòu)買軟件來(lái)搭建環(huán)境,可謂相當(dāng)費(fèi)時(shí)費(fèi)力。


        惠普最近升級(jí)的 HP Z8 G4 工作站,不論在開(kāi)發(fā)環(huán)境的搭建還是到硬件的布局配置,都為我們帶來(lái)了一套完整的解決方案。這是一款搭載英特爾 Xeon 可擴(kuò)展處理器和英偉達(dá) Quadro RTX 顯卡的高端計(jì)算設(shè)備。


        對(duì)于 AI 學(xué)習(xí)和研究者而言,訓(xùn)練深度學(xué)習(xí)模型需要耗費(fèi)不少精力。除了軟件環(huán)境和框架,硬件配置的很多方面都會(huì)影響到實(shí)驗(yàn)效率。在處理模型時(shí),硬盤會(huì)影響數(shù)據(jù)讀取的速度,CPU 會(huì)影響輸入效率,GPU 影響訓(xùn)練速度,顯存大小也與 Batch Size 強(qiáng)相關(guān)。

        如果有一臺(tái)算力強(qiáng)大、配置合理的工作站,可以幫助我們高效完成實(shí)驗(yàn),對(duì)于工作來(lái)說(shuō)是相當(dāng)重要的。

        近日,Kaggle AI 競(jìng)賽愛(ài)好者 Gary 體驗(yàn)了一把用 HP Z8 G4 工作站做 AI 的強(qiáng)大能力。在 Gary 看來(lái),不論是從開(kāi)發(fā)環(huán)境的搭建還是到硬件的布局配置,該工作站都已經(jīng)提供了非常完整與合理的優(yōu)化和調(diào)整。在 HP Z8 G4 工作站的幫助下,他也在一些比賽中獲得好成績(jī)。

        下面,就讓我們從 Gary 的測(cè)評(píng)結(jié)果中,了解下 HP Z8 G4 工作站以及它訓(xùn)練 AI 模型的能力。

        惠普 Z8 G4 工作站的硬件配置

        和所有臺(tái)式機(jī)一樣,HP Z8 G4 的關(guān)鍵硬件是可自由選配的,不過(guò)它最多可以搭載兩個(gè) CPU、六塊硬盤和三張顯卡。

        機(jī)箱外觀

        HP Z8 G4 的機(jī)箱采用了黑色磨砂鋁制外殼,其設(shè)計(jì)讓人感覺(jué)非常沉穩(wěn)。機(jī)箱內(nèi)部布局十分清晰,采用模塊化設(shè)計(jì),每一個(gè)模塊都可以進(jìn)行卡扣式的拆卸操作,利于擴(kuò)展或升級(jí)硬件配置。


        工作站外觀與內(nèi)部布局

        CPU 處理器

        用于測(cè)試的 HP Z8 G4 搭配了雙英特爾 Xeon Gold 6254 處理器,帶有 18 個(gè)核心,36 個(gè)線程,標(biāo)準(zhǔn)頻率 3.1GHz,睿頻頻率 4.0GHz。相比最多 10 核 20 線程的酷睿 i9,「至強(qiáng)」的功率更大,核心更多。在涉及到復(fù)雜的數(shù)據(jù)處理或需要在 CPU 下進(jìn)行模型訓(xùn)練的情況下,多核的 CPU 帶有天然的優(yōu)勢(shì)。

        CPU 參數(shù)

        GPU

        這臺(tái) HP Z8 G4 搭配了兩塊英偉達(dá) Quadro RTX 6000 GPU,其采用「圖靈」架構(gòu)的 NVIDIA RTX 平臺(tái),同時(shí)利用硬件加速光線追蹤、深度學(xué)習(xí)和先進(jìn)的著色技術(shù)大幅提升工作效率,每塊 RTX 6000 都帶有 24GB GDDR6 的顯存和 4608 個(gè) CUDA 核心,以及 576 個(gè) Tensor Core,可以實(shí)現(xiàn) 16.3 TFLOPS 的 FP32 算力,輕松訓(xùn)練更深、更大的深度學(xué)習(xí)模型。

        GPU 參數(shù)

        內(nèi)存和硬盤

        這臺(tái) HP Z8 G4 搭配了 8×12 96GB 的內(nèi)存和 2×1TB M.2 SSD 固態(tài)硬盤,按照惠普官方說(shuō)明,它可最多擴(kuò)展至 3TB 內(nèi)存,同時(shí)機(jī)箱提供了 4 個(gè) 3.5/2.5 英寸的硬盤位,可自由擴(kuò)展更大的硬盤空間。

        以下是 Gary 使用 HP Z8 G4 工作站做出的測(cè)評(píng)結(jié)果。

        不同 CNN 模型在 HP Z8 G4 的訓(xùn)練速度對(duì)比

        在這里所使用的訓(xùn)練數(shù)據(jù)將會(huì)被 resize 到 256×256 像素,并進(jìn)行一些不同的數(shù)據(jù)增強(qiáng),然后進(jìn)行訓(xùn)練。

        訓(xùn)練數(shù)據(jù)

        分類任務(wù)的訓(xùn)練

        Gary 在 HP Z8 G4 上進(jìn)行一些 CNN backbone 模型的訓(xùn)練,后續(xù)進(jìn)行 float32/16 的速度對(duì)比,并且會(huì)盡可能把 GPU 利用率提供到 100%,使得每個(gè)模型都在接近相同的 GPU 利用率下計(jì)算速度。作者選了一些常規(guī)網(wǎng)絡(luò)類型,如 ResNet,EfficientNet 來(lái)進(jìn)行訓(xùn)練速度基準(zhǔn)測(cè)試。

        單 GPU 訓(xùn)練 / 測(cè)試速度對(duì)比

        通過(guò)對(duì)比可以看出,得益于 RTX6000 強(qiáng)大的浮點(diǎn)運(yùn)算能力,工作站的單卡訓(xùn)練速度也非常優(yōu)秀。不論是在訓(xùn)練還是前向推理的模式上,由于 RTX 系列 GPU 對(duì) Float16 推理加速已經(jīng)進(jìn)行了特別的優(yōu)化,使得訓(xùn)練 / 推理速度,在大部分模型下都可以獲得接近翻倍的速度提升。

        雙 GPU 訓(xùn)練速度對(duì)比

        如果測(cè)試雙卡并行訓(xùn)練的速度,對(duì)比單 GPU+float16 訓(xùn)練時(shí),又可以獲得接近一倍的速度提升,雙卡并行可以充分發(fā)揮工作站強(qiáng)大 GPU 的性能。

        數(shù)據(jù)增強(qiáng)處理

        Gary 使用了 ResNet50 與大量復(fù)雜數(shù)據(jù)增強(qiáng)方式進(jìn)行訓(xùn)練,大部分?jǐn)?shù)據(jù)增強(qiáng)都是在 CPU 上進(jìn)行處理的,需要消耗比較大 CPU 資源。如下圖中的對(duì)比,在使用 32 線程與 0 線程時(shí),速度可以差異到 10 倍以上,HP Z8 G4 帶有 72 線程的 CPU,在處理數(shù)據(jù)的速度上有著較大的優(yōu)勢(shì)。

        多線程對(duì)訓(xùn)練速度的影響

        散熱表現(xiàn)

        HP Z8 G4 工作站可以保證即使是在高負(fù)載的情況下,內(nèi)部溫度仍保持在合理范圍內(nèi)??梢杂^察到,即使在 100% 的 GPU 使用率情況下,HP Z8 G4 的 NVIDIA RTX 6000 GPU 也只保持在 60 攝氏度左右。需要注意的是,這是在沒(méi)有引入水冷散熱的情況下。

        GPU 的散熱表現(xiàn)

        總結(jié)

        HP Z8 G4 不僅易于擴(kuò)展,從模型的訓(xùn)練使用體驗(yàn)來(lái)看,模型訓(xùn)練速度快,并且其提供了較大的顯存,可以更好地提升模型的性能。

        據(jù)惠普最新版本的說(shuō)明,Z8 G4 還可以升級(jí)為 NVIDIA Quadro RTX 8000,單卡擁有 48GB 的顯存,是 RTX 6000 的 2 倍,GPU 性能更為強(qiáng)大。對(duì)于 AI 開(kāi)發(fā)者而言,HP Z8 G4 工作站是一個(gè)很好的選擇。

        參考原文:
        AI戰(zhàn)斗機(jī)——HP Z8 G4工作站,高強(qiáng)性能大秀Ready Go→
        HP Z8 G4 工作站  配置清單 · 惠普 2021 年 5 月版
        https://www8.hp.com/h20195/v2/GetPDF.aspx/c05527763.pdf


        往期精彩:

        【原創(chuàng)首發(fā)】機(jī)器學(xué)習(xí)公式推導(dǎo)與代碼實(shí)現(xiàn)30講.pdf

        【原創(chuàng)首發(fā)】深度學(xué)習(xí)語(yǔ)義分割理論與實(shí)戰(zhàn)指南.pdf

         談中小企業(yè)算法崗面試

         算法工程師研發(fā)技能表

         真正想做算法的,不要害怕內(nèi)卷

         算法工程師的日常,一定不能脫離產(chǎn)業(yè)實(shí)踐

         技術(shù)學(xué)習(xí)不能眼高手低

         技術(shù)人要學(xué)會(huì)自我營(yíng)銷

         做人不能過(guò)擬合

        求個(gè)在看

        瀏覽 79
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評(píng)論
        圖片
        表情
        推薦
        點(diǎn)贊
        評(píng)論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            乱妇熟女网 | 亚洲欧美日韩成人高清在线一区 | 嗯嗯啊啊视频在线观看 | 78m国产成人精品视频 | 99在线观看免费 | 国产成人爽视频 | 涩涩视频一区二区三区 | 影音先锋最新资源网 | 黄色一级片网站 | 成人做爰黄A片免费看三 |