1000層transformer橫空出世!
點(diǎn)藍(lán)色字關(guān)注“機(jī)器學(xué)習(xí)算法工程師”
設(shè)為星標(biāo),干貨直達(dá)!

轉(zhuǎn)自新智元公眾號(hào)
編輯:David 拉燕
【導(dǎo)讀】近日,微軟研究院的研究人員搞出了一個(gè)1000層的Transformer,在多語種機(jī)器翻譯任務(wù)上刷新多項(xiàng)SOTA

論文鏈接:https://arxiv.org/abs/2203.00555

超深的Transformer:DEEPNET



性能:1000層網(wǎng)絡(luò),顯著提升NMT表現(xiàn)



大規(guī)模多語言神經(jīng)機(jī)器翻譯


參考鏈接:
https://arxiv.org/abs/2203.00555
推薦閱讀
輔助模塊加速收斂,精度大幅提升!移動(dòng)端實(shí)時(shí)的NanoDet-Plus來了!
SSD的torchvision版本實(shí)現(xiàn)詳解
機(jī)器學(xué)習(xí)算法工程師
? ??? ? ? ? ? ? ? ? ? ? ????????? ??一個(gè)用心的公眾號(hào)

評(píng)論
圖片
表情
