旋轉(zhuǎn)角度目標檢測的重要性?。。。ǜ皆凑撐南螺d)
點擊下方“AI算法與圖像處理”,一起進步!
重磅干貨,第一時間送達

論文地址:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9521517
計算機視覺研究院專欄
作者:Edison_G
任意方向的目標檢測是一項具有挑戰(zhàn)性的任務。


三、新框架

新提出的旋轉(zhuǎn)檢測器框架如上圖所示。網(wǎng)絡基于RetinaNet框架。圖中標記為C2、C3、C4的特征圖是由深度卷積神經(jīng)網(wǎng)絡提取的。該方法的總體步驟如下:首先利用特征提取網(wǎng)絡對遙感圖像中的特征進行提取,利用NAS-FPN對提取的特征進行融合,得到不同尺度的特征圖。然后,使用長邊定義方法來表示旋轉(zhuǎn)檢測框,并在框回歸任務中使用二進制編碼標記技術將角度回歸問題轉(zhuǎn)化為角度分類問題。下面詳細描述該方法中的一些重要結(jié)構(gòu)。
NAS-FPN
在NAS-FPN中,最重要的結(jié)構(gòu)是由特征圖節(jié)點集合、操作池和搜索終止條件組成的合并單元結(jié)構(gòu)。下圖簡要描述了特征圖的搜索過程。

1)從特征圖節(jié)點集中隨機選擇一個特征圖作為輸入之一。初始特征圖節(jié)點集包含五個尺度的特征圖,表示為 {C1,C2, C3, C4, C5}。
2)從特征圖節(jié)點集中隨機選擇另一個特征圖作為另一個輸入。
3)選擇輸出特征圖的分辨率。
4)在操作池中選擇一個操作對(1)(2)中選擇的特征圖節(jié)點進行操作,產(chǎn)生與輸出特征圖分辨率相同的特征圖,并將該特征圖加入到特征圖節(jié)點集合中選擇。
5) 循環(huán)重復上述步驟。搜索的終止條件是生成五個與初始特征圖分辨率相同的特征金字塔網(wǎng)絡,記為{P1, P2, P3, P4, P5}。
ROTATION DETECTION FRAME
典型的角度編碼方法有三種,包括兩種不同角度范圍的五參數(shù)方法和一種八參數(shù)方法。詳細情況如下:

角度范圍為90°的五參數(shù)法(OpenCV定義法):其示意圖如上圖所示。該定義法包含五個參數(shù)[x,y,w,h,θ]。其中,x和y為旋轉(zhuǎn)坐標系的中心坐標,θ為旋轉(zhuǎn)坐標系與x軸的銳角,逆時針方向指定為負角,因此角度范圍為[?90° , 0); 旋轉(zhuǎn)框的寬度w為旋轉(zhuǎn)框所在的邊角,旋轉(zhuǎn)框的高度h為另一邊。

180°角范圍的五參數(shù)法

八參數(shù)法
八參數(shù)法:該定義方法示意圖如上圖所示,該定義方法包含8個參數(shù)[a1,a2,b1,b2,c1,c2,d1,d2], 定義的左上角為起點,其余點按逆時針順序排列。旋轉(zhuǎn)坐標系的表示不限于上述三種方法,旋轉(zhuǎn)坐標系其余部分的表示可以通過上述三種方法的變換得到。
ANGLE CODING METHOD

90°范圍的五參數(shù)定義方法的問題

八參數(shù)四邊形定義方法的問題
角度編碼方法:


四、實驗及可視化
實驗環(huán)境

DOTA數(shù)據(jù)集上的性能比較



交流群
歡迎加入公眾號讀者群一起和同行交流,目前有美顏、三維視覺、計算攝影、檢測、分割、識別、醫(yī)學影像、GAN、算法競賽等微信群
個人微信(如果沒有備注不拉群!) 請注明:地區(qū)+學校/企業(yè)+研究方向+昵稱
下載1:何愷明頂會分享
在「AI算法與圖像處理」公眾號后臺回復:何愷明,即可下載。總共有6份PDF,涉及 ResNet、Mask RCNN等經(jīng)典工作的總結(jié)分析
下載2:終身受益的編程指南:Google編程風格指南
在「AI算法與圖像處理」公眾號后臺回復:c++,即可下載。歷經(jīng)十年考驗,最權(quán)威的編程規(guī)范!
下載3 CVPR2021 在「AI算法與圖像處理」公眾號后臺回復:CVPR,即可下載1467篇CVPR?2020論文 和 CVPR 2021 最新論文

