「煉丹」師的福音!支持AMD GPU,PyTorch 1.8來了!

新智元報道
【新智元導讀】PyTorch1.8發(fā)布,整體來看,本次更新涵蓋1.7版本發(fā)布以來,共計3000多次Github提交,包括編譯、代碼優(yōu)化、科學計算前端 API 以及通過 pytorch.org 提供的二進制文件支持AMD ROCm。
PyTorch是一個開源的Python機器學習庫。2017年1月,由Facebook人工智能研究院(FAIR)基于Torch推出了PyTorch,用于自然語言處理等應用程序。

支持通過 torch.fx進行函數(shù)轉(zhuǎn)換;
增加和調(diào)整 API以支持 FFT( torch.fft )、線性代數(shù)函數(shù)( torch.linalg )
添加了復雜張量自動求導(autograd)的支持,并提升了矩陣計算 hessian 和 jacobian 的能力;
對分布式訓練進行了重大更新和改進,包括:改進 NCCL 可靠性,支持管道并行,RPC 分析,支持添加梯度壓縮的通訊 鉤子。

[穩(wěn)定版] Torch.fft 支持高性能 NumPy 中的 FFT
[測試版] torch.linalg 將支持 NumPy 中的線性代數(shù)函
[測試版] 利用 FX 進行 Pthon 代碼轉(zhuǎn)換。

ZeroRedundancyOptimizer:有助于減少每個線程的內(nèi)存占用;
進程組 NCCL 發(fā)送/接收:允許用戶在 Python 層(而非 C++ 層)實現(xiàn)集合操作;
RPC 中用 TensorPipe 支持 CUDA:為使用 PyTorch RPC 和多 GPU 機器的用戶帶來速度提升;
遠程模塊:允許用戶像操作本地模塊那樣操作遠程 worker 上的模塊。
iOS 端用 DeepLabV3 進行圖像分割
Android 端用 DeepLabV3 進行圖像分割


Benchmark utils
FX Graph Mode Quantization
強化 PyTorch Dispatcher 的能力,使其適應 C++ 中后端開發(fā)
AMD GPU 二進制文件現(xiàn)已推出
需要注意的是,PyTorch 1.8 僅在 Linux 系統(tǒng)中支持 AMD ROCm。


評論
圖片
表情

