1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        卷積神經(jīng)網(wǎng)絡是如何實現(xiàn)不變性特征提取的

        共 2267字,需瀏覽 5分鐘

         ·

        2021-04-29 11:28

        點擊上方小白學視覺”,選擇加"星標"或“置頂

        重磅干貨,第一時間送達

        本文轉自:OpenCV學堂


        圖像特征

        傳統(tǒng)的圖像特征提取(特征工程)主要是基于各種先驗模型,通過提取圖像關鍵點、生成描述子特征數(shù)據(jù)、進行數(shù)據(jù)匹配或者機器學習方法對特征數(shù)據(jù)二分類/多分類實現(xiàn)圖像的對象檢測與識別。卷積神經(jīng)網(wǎng)絡通過計算機自動提取特征(表示工程)實現(xiàn)圖像特征的提取與抽象,通過MLP實現(xiàn)數(shù)據(jù)的回歸與分類。二者提取的特征數(shù)據(jù)都具不變性特征。

        卷積神經(jīng)網(wǎng)絡為什么能提取到圖像特征,其關鍵在于卷積神經(jīng)網(wǎng)絡有兩種不同類型的層
        -卷積層(convolution layers/detection layers)
        -池化層(pooling layers)

        卷積層


        卷積層是一系列濾波器集合(filters set)、它的輸出結果被稱為特征映射(feature maps),每個feature map都一個filter在圖像上卷積得到的輸出。一般情況下都會輸出結果加線性修正,對卷積層常用就是ReLU

        這樣做的好處是:

        1. 卷積是一個線性操作,我們需要一個非線性組合,否則兩個卷積卷積層還不如一個卷積層

        2. 兩個相反方向的邊緣不應該被取消

        3. 使圖像梯度值更加的稀疏、有助于提高反向傳播的效果
          假設灰度輸入圖像,有兩個filter,卷積層生成過程如下所示:

        假設灰度輸入圖像,有兩個filter,卷積層生成過程如下所示:


        膨脹卷積


        通常我們常見的卷積層操作使用的filter都是基于連續(xù)鄰近像素的,除了這種卷積filter之后另外還有一張卷積filter被稱為膨脹卷積,其算子的分布更加的稀疏,圖示如下:

        膨脹卷積在不增加網(wǎng)絡總參數(shù)的情況下,提升每個感受野的尺度大小。

        1x1卷積


        1x1的卷積首次使用是在Network In Network網(wǎng)絡模型中,后來受到越來越多的關注,在一般情況下我們的卷積是2D的,1x1的卷積操作是毫無意義的,但是對卷積神經(jīng)網(wǎng)絡來說,它的卷積層是三維的,所以1x1的卷積操作是有意義的。


        卷積層大小計算


        對于一個輸入大小WxW的feature map,假設Filter的大小位FxF,卷積時填充邊緣P個像素、卷積步長(stride)為S則輸出的大小為:

        在多數(shù)深度學習框架中支持兩種輸出大小計算:

        padding = “same”

        意味著使用填充邊緣的方式,輸出大小與輸入的feature map大小保持不變


        padding = “valid”

        意味著不使用邊緣填充,即P=0此時輸出大小為:


        池化層


        在卷積層提取到的特征數(shù)據(jù)不具備空間不變性(尺度與遷移不變性特征),只有通過了池化層之后才會具備空間不變性特征。池化層是針對每個feature map進行池化操作,池化操作的窗口大小可以指定為任意尺寸,主要有兩種類型的池化操作

        -下采樣池化(均值池化)
        -最大值池化

        下采樣池化

        對每個窗口大小取均值,然后乘以標量beta加上我們增益偏置b的輸出

        最大值池化

        無論是選擇哪種池化方式都會輸出一個新低分辨率feature map,多數(shù)時候這個過程中會包含一定的信息損失,所以卷積神經(jīng)網(wǎng)絡一般通過擴展深度(增加feature map的數(shù)量)來補償。

        重疊窗口與稀疏窗口
        在進行池化的時候我們?nèi)绻x擇步長=1進行池化,通過這樣的池化方式輸出的結果我們稱為重疊池化輸出,它不利于特征的稀疏生成,重疊窗口池化與均值池化都有這樣的缺點,所以經(jīng)常采樣的是最大值池化,同時不會進行窗口重疊,有實驗結果表明,在卷積層保持相同feature map與參數(shù)的情況下,最大值池化的結果明顯優(yōu)于重疊池化與均值池化,而且網(wǎng)絡的深度越深,兩者之間的準確度差異越大。

        總結


        最終卷積神經(jīng)網(wǎng)絡經(jīng)過池化層操作對單位像素遷移和亮度影響進行了校正,做到了圖像的遷移與亮度不變性的特征提取、而且在池化過程中通過不斷的降低圖像分辨率,構建了圖像的多尺度特征,所以還具備尺度空間不變性,完成了圖像不變性特征提取工作。



        下載1:OpenCV-Contrib擴展模塊中文版教程
        在「小白學視覺」公眾號后臺回復:擴展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴展模塊教程中文版,涵蓋擴展模塊安裝、SFM算法、立體視覺、目標跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。

        下載2:Python視覺實戰(zhàn)項目52講
        小白學視覺公眾號后臺回復:Python視覺實戰(zhàn)項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個視覺實戰(zhàn)項目,助力快速學校計算機視覺。

        下載3:OpenCV實戰(zhàn)項目20講
        小白學視覺公眾號后臺回復:OpenCV實戰(zhàn)項目20講,即可下載含有20個基于OpenCV實現(xiàn)20個實戰(zhàn)項目,實現(xiàn)OpenCV學習進階。

        交流群


        歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學影像、GAN、算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進入相關微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~


        瀏覽 42
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            亚洲性爱视频网站 | 干骚视频 | 大香蕉操逼录像视频 | 色五月久久婷婷综合片丁香花 | 淫香淫色插插插 | 伊人狠狠 | 婷婷五月天影院 | 不卡在线中文字幕 | 一起操在线观看 | 大香蕉香蕉网成人精品视频 |