考慮成本可以買 RTX 2080Ti,想要高性能并且高性價比可以買 TITAN RTX,土豪可以選 Tesla V100。RTX 2080 顯存較小,不推薦。GTX1080Ti 已經(jīng)出了太久了,網(wǎng)上都是二手卡,不推薦。采購顯卡的時候,一定要注意買渦輪版的,不要買兩個或者三個風(fēng)扇的版本,除非你只打算買一張卡。因為渦輪風(fēng)扇的熱是往外機箱外部吹的,所以可以很好地帶走熱量,散熱比較好。如果買三個風(fēng)扇的版本,插多卡的時候,上面的卡會把熱量吹向第二張卡,導(dǎo)致第二張卡溫度過高,影響性能。風(fēng)扇顯卡很有可能是超過雙槽寬的,第二張卡可能插不上第二個 PCI-E 插槽,這個也需要注意。除了用于訓(xùn)練,還有一類卡是用于推斷的(只預(yù)測,不訓(xùn)練),如:這些卡全部都是不帶風(fēng)扇的,但它們也需要散熱,需要借助服務(wù)器強大的風(fēng)扇被動散熱,所以只能在專門設(shè)計的服務(wù)器上運行,具體請參考英偉達官網(wǎng)的說明。性價比之選應(yīng)該是 Tesla T4,但是發(fā)揮全部性能需要使用 TensorRT 深度優(yōu)化,目前仍然存在許多坑,比如當你的網(wǎng)絡(luò)使用了不支持的運算符時,需要自己實現(xiàn)。英偉達只允許這類卡在服務(wù)器上運行,像 GTX 1080Ti、RTX 2080Ti 都是不能在數(shù)據(jù)中心使用的。No Datacenter Deployment. The SOFTWARE isnot licensed for datacenter deployment, except that blockchain processing in adatacenter is permitted.
PCIE 3.0 x4(NVMe),速度 3.94GB/s下面是根據(jù)代表產(chǎn)品查詢的參數(shù):SATA3 機械硬盤沒有太好的數(shù)據(jù)來源,所以數(shù)據(jù)是經(jīng)驗值SATA3 固態(tài)硬盤數(shù)據(jù)來源:三星(SAMSUNG)1TB SSD固態(tài)硬盤 SATA3.0接口 860 EVONVMe 固態(tài)硬盤數(shù)據(jù)來源:英特爾(Intel)1TB SSD固態(tài)硬盤 M.2接口(NVMe協(xié)議) 760P系在面對大量小文件的時候,使用 NVMe 硬盤可以一分鐘掃完 1000萬文件,如果使用普通硬盤,那么就需要一天時間。為了節(jié)省生命,簡化代碼,硬盤建議選擇 NVMe 協(xié)議的固態(tài)硬盤。如果你的主板不夠新,沒有NVMe 插槽,你可以使用 M.2 轉(zhuǎn)接卡將 M.2 接口轉(zhuǎn)為PCI-E 接口。內(nèi)存容量的選擇通常大于顯存,比如單卡配 16GB 內(nèi)存,四卡配 64GB 內(nèi)存。由于有數(shù)據(jù)生成器(DataLoader),數(shù)據(jù)不必全部加載到內(nèi)存里,通常不會成為瓶頸。先計算功率總和,如單卡 CPU 100W,顯卡 250W,加上其他的大概 400W,那么就買 650W 的電源。雙卡最好買 1000W 以上的電源,四卡最好買 1600W 的電源,我這里實測過四卡機用 1500W 的電源來帶,跑起來所有的卡以后會因為電源不足而自動關(guān)機。一般墻上的插座只支持 220V 10A,也就是 2200W 的交流電,由于電源要把交流電轉(zhuǎn)直流電,所以會有一些損耗,最高只有1600W,因此如果想要支持八卡,最好不要在家嘗試。八卡一般是雙電源,并且需要使用專用的 PDU 插座,并且使用的是 16A 插口,如果在家使用,會插不上墻上的插座。一般主板自帶千兆網(wǎng)卡。如果需要組建多機多卡集群,請聯(lián)系供應(yīng)商咨詢專業(yè)的解決方案。如果配單卡,可以直接買個普通機箱,注意顯卡長度能放下就行。如果配四卡機器,建議買一個 Air 540 機箱,因為我正在用這一款。深度學(xué)習(xí)工作站裝好系統(tǒng)以后就不需要顯示器了,裝系統(tǒng)的時候使用手邊的顯示器就行。深度學(xué)習(xí)工作站裝好系統(tǒng)以后就不需要鍵盤鼠標了,裝系統(tǒng)的時候使用手邊的鍵盤鼠標就行。?
參考鏈接
Turing 架構(gòu)白皮書
Volta 架構(gòu)白皮書
RTX 2080 Ti Deep Learning Benchmarks with TensorFlow - 2019
https://developer.nvidia.com/deep-learning-performance-training-inference
https://www.nvidia.cn/object/where-to-buy-tesla-catalog-cn.html
https://www.supermicro.org.cn/support/resources/gpu/
https://www.geforce.com/drivers/license/geforce