PyTorch 1.8來了!正式支持AMD GPU,煉丹爐不止NVIDIA...
點擊上方“AI算法與圖像處理”,選擇加"星標"或“置頂”
重磅干貨,第一時間送達
夢晨 發(fā)自 凹非寺
來源:量子位(QbitAI)
1.8版本中,官方終于加入了對AMD ROCm的支持,可以方便的在原生環(huán)境下運行,不用去配置Docker了。

△AMD ROCm只支持Linux操作系統(tǒng)
1.8版本集合了自2020年10月1.7發(fā)布以來的超過3000次GitHub提交。
此外,本次更新還有諸多亮點:
優(yōu)化代碼,更新編譯器
Python內(nèi)函數(shù)轉(zhuǎn)換
增強分布式訓(xùn)練
新的移動端教程與演示
新的性能檢測工具
相關(guān)的庫TorchCSPRNG, TorchVision, TorchText和TorchAudio也會隨之更新。
要注意的是,自1.6起,Pytorch新特性將分為Stable、Beta、Prototype三種版本。其中Prototype不會包含到穩(wěn)定發(fā)行版中,需要從Nightly版本自行編譯。
Python to Python函數(shù)轉(zhuǎn)換
新增的Beta特性torch.fx可以實現(xiàn)Python到Python的函數(shù)轉(zhuǎn)換,可以方便的加入任何工作流程。

新的API,向NumPy學(xué)習(xí)!
1.7版本中增加的Beta特性torch.fft已成為正式特性。實現(xiàn)了與Numpy中的np.fft類似的快速傅立葉變換,還增加了硬件加速支持與自動求導(dǎo),以更好的支持科學(xué)計算。
還增加了Beta版NumPy風(fēng)格的線性代數(shù)模塊torch.linalg,支持Cholesky分解、行列式、特征值等功能。
增強分布式訓(xùn)練
增加了穩(wěn)定的異步錯誤與超時處理,增加NCCL的可靠性。
增加了Beta版的流水線并行功能*(Pipeline Parallelism)*,可將數(shù)據(jù)拆解成更小的塊以提高并行計算效率。
△Pipeline Parallelism使用4個GPU時的工作示意圖
增加Beta版的DDP通訊鉤子,用于控制如何在workers之間同步梯度。
另外還有一些Prototype版的分布式訓(xùn)練新特性。
ZeroRedundancyOptimizer:用于減少所有參與進程的內(nèi)存占用。
Process Group NCCL Send/Recv:讓用戶可在Python而不是C++上進行集合運算。
CUDA-support in RPC using TensorPipe:增加對N卡多卡運算的效率。
Remote Module:讓用戶像操作本地模塊一樣操作遠程模塊。
移動端新教程
隨本次更新發(fā)布了圖像分割模型DeepLabV3在安卓和IOS上的詳細教程。
以及圖像分割、目標檢測、神經(jīng)機器翻譯等在安卓和IOS上的演示程序,方便大家更快上手。



另外還有PyTorch Mobile Lite Interpreter解釋器,可以減少運行時文件的大小。
性能檢測工具
增加Beta版的Benchmark utils,用戶可以進行精確的性能測試。
以及Prototype版的FX Graph Mode Quantization,實現(xiàn)了量化過程的自動化。
更多新版本詳情,見下方鏈接。
參考鏈接:
[1]https://pytorch.org/blog/pytorch-1.8-released/
[2]https://twitter.com/cHHillee/status/1367621538791317504
個人微信(如果沒有備注不拉群!) 請注明:地區(qū)+學(xué)校/企業(yè)+研究方向+昵稱
下載1:何愷明頂會分享
在「AI算法與圖像處理」公眾號后臺回復(fù):何愷明,即可下載。總共有6份PDF,涉及 ResNet、Mask RCNN等經(jīng)典工作的總結(jié)分析
下載2:終身受益的編程指南:Google編程風(fēng)格指南
在「AI算法與圖像處理」公眾號后臺回復(fù):c++,即可下載。歷經(jīng)十年考驗,最權(quán)威的編程規(guī)范!
下載3:Python視覺實戰(zhàn)項目52講 在「AI算法與圖像處理」公眾號后臺回復(fù):Python視覺實戰(zhàn)項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個視覺實戰(zhàn)項目,助力快速學(xué)校計算機視覺。
覺得不錯就點亮在看吧

