CVPR2021|特征金字塔的新方式Y(jié)OLOF
論文:You Only Look One-level Feature
下載地址:
https://arxiv.org/abs/2103.09460
代碼:
https://github.com/megvii-model/YOLOF
Introduction

(1) 這表明C5層基本融合了全部語(yǔ)義信息,沒(méi)必要進(jìn)行多尺度融合。
(2) 分而治之帶來(lái)的益處遠(yuǎn)多于多尺度特征融合。

經(jīng)過(guò)分析,SiSo精度低的原因是有兩個(gè):
(1) 與C5的特征感受野的匹配的尺度范圍有限。
(2) 在單層通過(guò)稀疏anchor方式產(chǎn)生的positive anchor數(shù)量極其不平衡。
Methods
Dilated Encoder

Uniform Matching
因此Uniform Matching的方式是使用最近鄰方式來(lái)匹配。具體方式是選擇GT boxes最近的K個(gè)boxes, 這樣的方式不管GT boxes大小可以匹配相同數(shù)量的Boxes。
conclusion
1.以608x608的輸入,YOLOF 在2080Ti上以60fps的速度實(shí)現(xiàn)了44.3 mAP的精度。
2.與YOLO_v4相比,在提高了0.8mAP的基礎(chǔ)上快了13%。
3.達(dá)到RetinaNet的精度,并比它快2.5倍。
4.僅用了一層特征就達(dá)到了DETR的精度,訓(xùn)練速度快了7倍。
?------------------------------------------------
歡迎微信搜索并關(guān)注「目標(biāo)檢測(cè)與深度學(xué)習(xí)」,不被垃圾信息干擾,只分享有價(jià)值知識(shí)!
10000+人已加入目標(biāo)檢測(cè)與深度學(xué)習(xí)
![]()
![]()
敬正在努力的我們! 
