PyTorch 1.10正式版上線:Android NNAPI支持來(lái)了
點(diǎn)擊下方卡片,關(guān)注“新機(jī)器視覺”公眾號(hào)
視覺/圖像重磅干貨,第一時(shí)間送達(dá)
機(jī)器之心報(bào)道
廣受人們歡迎的深度學(xué)習(xí)框架 PyTorch 剛剛更新了 1.10 正式版,在 CUDA Graphs API 等方面進(jìn)行了諸多改進(jìn)。

集成了 CUDA Graphs API 以減少 CUDA 工作負(fù)載的 CPU 開銷; FX、torch.special 和 nn.ModuleParametrization 等幾個(gè)前端 API 已從測(cè)試版變?yōu)榉€(wěn)定版; 除了 GPU 之外,JIT Compiler 中對(duì)自動(dòng)融合的支持?jǐn)U展到 CPU; Android NNAPI 支持現(xiàn)已推出測(cè)試版。

Remote Module(穩(wěn)定版):此功能允許用戶遠(yuǎn)程操作模塊,就像使用本地模塊一樣,其中 RPC 對(duì)用戶是透明的; DDP Communication Hook(穩(wěn)定版):此功能允許用戶覆蓋 DDP 如何跨進(jìn)程同步梯度; ZeroRedundancyOptimizer(穩(wěn)定版):此功能可與 DistributedDataParallel 結(jié)合使用,以減少每個(gè)進(jìn)程優(yōu)化器狀態(tài)的大小。
增強(qiáng)型內(nèi)存視圖:這有助于用戶更好地了解內(nèi)存使用; 增強(qiáng)型內(nèi)核視圖:附加列顯示網(wǎng)格和塊大小以及每個(gè)線程共享內(nèi)存使用和寄存器的情況; 分布式訓(xùn)練:Gloo 現(xiàn)在支持分布式訓(xùn)練工作; TensorCore:該工具顯示 Tensor Core(TC) 的使用,并為數(shù)據(jù)科學(xué)家和框架開發(fā)人員提供建議; NVTX:對(duì) NVTX markers 的支持是從舊版 autograd profiler 移植過(guò)來(lái)的; 支持移動(dòng)設(shè)備分析:PyTorch profiler 現(xiàn)在與 TorchScript 、移動(dòng)后端能夠更好的集成,支持移動(dòng)工作負(fù)載的跟蹤收集。

—版權(quán)聲明—
僅用于學(xué)術(shù)分享,版權(quán)屬于原作者。
若有侵權(quán),請(qǐng)聯(lián)系微信號(hào):yiyang-sy 刪除或修改!
評(píng)論
圖片
表情
