目標檢測CBNet
到目前為止(2019.10.24),在COCO數(shù)據(jù)集上表現(xiàn)最佳的目標檢測網(wǎng)絡(單模型非ensemble)是CBNet,COCO測試集上的mAP為53.3。

作者聲稱,合并功能更強大的backbone可提高目標檢測器的性能。為此,他們提出了一種新穎的策略,通過相鄰backbone之間的復合連接(Composite Connection)來組合多個相同的backbone。這樣他們搞出了一個更強大的backbone,稱為復合骨干網(wǎng)絡(Composite Backbone Network)。

如上圖所示,CBNet由多個相同的backbone網(wǎng)絡和相鄰backbone網(wǎng)絡之間的復合連接組成。從左到右,助理backbone中每個階段的輸出,也可以看作是更高級別的features。每個feature級別的輸出作為輸入的一部分,通過復合連接流到后續(xù)backbone的并行階段。這樣將多個高級和低級特征融合在一起以生成更豐富的feature表示。
論文介紹了兩種類型的結(jié)構(gòu):雙backbone(DB)和三重backbone(TB)。從命名可以猜到,DB由兩個相同的backboone組成,而TB由三個相同的backbone組成。性能差異將在后面討論。
為了組合來自backbone的多個輸出,論文引入了一個復合連接模塊。該塊由一個1x1卷積和一個batch normalization層組成。添加這些層以減少通道數(shù)并執(zhí)行上采樣操作。
最后的backbone(在圖中最右側(cè))被稱為"Lead Backbone",用于目標檢測。每個輔助backbone的輸出作為其相鄰backbone的輸入, Lead Backboone輸出的feature則作為RPN /detection head的輸入。
復合樣式

復合樣式有四種:
相鄰的上級構(gòu)成(Adjacent Higher Level Composition)是上一節(jié)中介紹的樣式。助理backbone的每個輸出feature都通過復合連接模塊作為相鄰的backbone的輸入。
相同層級構(gòu)成(Same Level Composition)是另一種簡單的樣式,它將前一個backbone的相鄰同級的輸出feature直接并行傳到后面的backbone。如圖所示,此樣式未使用復合連接模塊。
相鄰的下級構(gòu)成(Adjacent Lower-Level Composition)與AHLC非常相似。唯一的區(qū)別是,來自之前backbone的較低級階段的feature將傳遞到后續(xù)backbone。
密集上級構(gòu)成(Dense Higher-Level Composition)受到DenseNet論文的啟發(fā),該論文的每一層都與之后的所有層相連來在每個階段中建立密集的連接。

上表顯示了不同構(gòu)成樣式之間的比較。我們可以觀察到AHLC樣式優(yōu)于其他復合樣式。原因在論文中已得到很好的解釋。作者聲稱,將先前backbone的低級feature直接添加到后續(xù)backbone的較高級feature會損害后繼feature的語義信息。另一方面,將前一個backbone的較深層feature添加到后繼backbone的較淺層feature中會增強后一feature的語義信息。
實驗結(jié)果

上表顯示了MS-COCO測試集上的檢測結(jié)果。第5–7列顯示目標檢測結(jié)果,而第8–10列顯示實例分割結(jié)果。明顯看到,利用更多的backbone結(jié)構(gòu)可以提高網(wǎng)絡的性能。
結(jié)論
論文展示了一種稱為CBNet的新穎架構(gòu)。通過組合多個backbone架構(gòu),建議的網(wǎng)絡將檢測網(wǎng)絡的準確率提高了約1.5%到3%。
當然模型參數(shù)大小和訓練時間都增加了,speed–accuracy trade-off需要進一步檢驗。
