1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        天氣情況圖像分類

        共 3401字,需瀏覽 7分鐘

         ·

        2021-12-18 21:17


        向AI轉(zhuǎn)型的程序員都關(guān)注了這個(gè)號??????

        機(jī)器學(xué)習(xí)AI算法工程?? 公眾號:datayx



        該數(shù)據(jù)集包含6個(gè)常見天氣類別的60000張圖像,這些類別包括晴天,多云,下雨,下雪,薄霧和雷雨天氣。

        數(shù)據(jù)說明

        各類天氣圖片數(shù)量:

        • 晴天:10000張

        • 多云:10000張

        • 雨天:10000張

        • 大雪:10000張

        • 薄霧:10000張

        • 雷雨:10000張

        數(shù)據(jù)來源

        http://vcc.szu.edu.cn/research/2017/RSCM.html


        數(shù)據(jù)清洗與可視化分析

        我對上面的圖片數(shù)據(jù)集進(jìn)行了一個(gè)大致的整理,有一些圖片我自己都分不清楚是什么類別,干脆手動刪除,打算做5個(gè)分類:haze 、 lingting 、sun snow、 cloudy,但是編號是個(gè)問題,下面使用python 進(jìn)行了編號處理,方便得很






        解決方案


        代碼?獲取方式:

        關(guān)注微信公眾號 datayx ?然后回復(fù)?天氣分類?即可獲取。



        針對本次賽題的任務(wù)特點(diǎn),我們團(tuán)隊(duì)采取了Swsl_resnext101_32x8d 網(wǎng)絡(luò)作為Backbone。同時(shí)創(chuàng)新性的引入了CBAM注意力機(jī)制, Label Smooth(標(biāo)簽平滑),OHEM(在線難例樣本挖掘),Arc-Loss等諸多創(chuàng)新設(shè)計(jì),使得我們的單模就能達(dá)到線上84.3+的F1-score,從比賽一開始就遙遙領(lǐng)先其他隊(duì)伍。兼顧了速度和精度,具有很高的實(shí)際應(yīng)用價(jià)值,同時(shí),通過最終的模型融合,更是達(dá)到了線上84.7+的精度。


        主干網(wǎng)絡(luò)(Backbone)選取

        ?2020年NeurIPS 中的一篇工作:Rethinking the Value of Labels for Improving Class-Imbalanced Learning中針對數(shù)據(jù)類別不平衡(也泛稱數(shù)據(jù)長尾分布)下的分類問題進(jìn)行研究并指出,如果直接把類別不平衡的樣本丟給模型用于學(xué)習(xí),模型會在major classes(在本次比賽中即“晴朗”類別)的樣本上的學(xué)習(xí)效果更好,而在minor classes(“多云”)上泛化效果差。同時(shí)該工作指出半監(jiān)督和自監(jiān)督均能顯著提升不平衡數(shù)據(jù)下的學(xué)習(xí)表現(xiàn),因此團(tuán)隊(duì)采用半弱監(jiān)督模型swsl_resnext101_32x8d作為本次比賽的backbone。由于數(shù)據(jù)集中存在大量的干擾背景,真正對最終分類結(jié)果影響較大的區(qū)域占比較小,因此團(tuán)隊(duì)在原始的swsl_resnext101_32x8d的基礎(chǔ)上添加注意力機(jī)制模塊CBAM,讓模型能夠更有效的學(xué)到關(guān)鍵區(qū)域。


        數(shù)據(jù)增廣選擇?

        本次比賽中訓(xùn)練集的數(shù)據(jù)量大,訓(xùn)練集和測試集的分布基本一致,訓(xùn)練集的樣本種類豐富。因此團(tuán)隊(duì)僅采用了兩種常見的數(shù)據(jù)增廣方案,只在圖像的尺寸等方便進(jìn)行增廣,力求在不破壞圖像原有特征的基礎(chǔ)上進(jìn)一步提高模型的泛化能力。


        上分tricks?

        搭建完基本的Backbone并選取合適的增廣策略之后,為進(jìn)一步提高團(tuán)隊(duì)所用模型在數(shù)據(jù)集上的泛化能力,團(tuán)隊(duì)根據(jù)模型在數(shù)據(jù)集上的線下線上表現(xiàn)選擇一些特定的Trick,這些創(chuàng)新方案也是我們團(tuán)隊(duì)能一直遙遙領(lǐng)先其他團(tuán)隊(duì)的關(guān)鍵所在。?


        Label Smooth(標(biāo)簽平滑)?

        在常見的多分類問題中,網(wǎng)絡(luò)輸出先經(jīng)過softmax處理后進(jìn)行交叉熵計(jì)算Loss,為了使得網(wǎng)絡(luò)對測試集預(yù)測的概率分布和其真實(shí)分布接近,常用的做法是使用one-hot對真實(shí)標(biāo)簽進(jìn)行編碼,而這種將標(biāo)簽強(qiáng)制one-hot的方式使網(wǎng)絡(luò)過于自信從而會導(dǎo)致過擬合發(fā)生,因此團(tuán)隊(duì)選擇用Label Smooth來軟化這種編碼方式。


        OHEM (在線難例樣本挖掘)?

        經(jīng)過線下實(shí)驗(yàn)發(fā)現(xiàn),團(tuán)隊(duì)采用的模型在訓(xùn)練過程中針對“cloudy”類別表現(xiàn)較差,如下圖所示。因此為進(jìn)一步提高對該類別的鑒別能力,團(tuán)隊(duì)采用OHEM來進(jìn)一步提高模型能力。OHEM最初在目標(biāo)檢測任務(wù)中提出,但是該思想在所有任務(wù)中都通用,團(tuán)隊(duì)選取當(dāng)前batch中Top k大的loss的均值作為當(dāng)前batch的loss進(jìn)行梯度的回傳, 提高batch中hard sample對網(wǎng)絡(luò)更新的作用。并實(shí)驗(yàn)發(fā)現(xiàn)該種方法能夠有效提高對“cloudy“的鑒別能力。


        CBAM注意力機(jī)制?

        前面談到過由于數(shù)據(jù)集中存在大量的干擾背景,真正對最終分類結(jié)果影響較大的區(qū)域占比較小,因此團(tuán)隊(duì)在原始的swsl_resnext101_32x8d的基礎(chǔ)上添加注意力機(jī)制模塊CBAM,讓模型能夠更有效的學(xué)到關(guān)鍵區(qū)域。


        訓(xùn)練細(xì)節(jié)和線上精度變化 訓(xùn)練細(xì)節(jié)

        • 優(yōu)化器:采取sgd.

        • 初始學(xué)習(xí)率:5e-4,

        • 學(xué)習(xí)率指數(shù)下降策略。

        • 2-3個(gè)epoch

        • 按照16w/1w劃分本地訓(xùn)練/驗(yàn)證集

        • 部分訓(xùn)練過程采取了apex半精度混合加速訓(xùn)練

        • 通過freeze多層網(wǎng)絡(luò)進(jìn)行多種變化的Fine-tune方式

        線上F1分?jǐn)?shù):

        • 單模型線上最高精度: 0.843+

        • 模型融合策略:通過對模型添加不同的Trick(Cbam注意力機(jī)制, Arc-Loss, OHEM, Label-Smooth)分別訓(xùn)練得到不同的多個(gè)模型,然后采取投票的方式,最終線上f1-score: 0.847+??梢娔P腿诤蠋淼氖找娌⒉幻黠@,我們的單模已經(jīng)達(dá)到了很高的精度同時(shí)有著很快的推理速度,速度精度較為平衡,具有實(shí)際應(yīng)用價(jià)值。



        機(jī)器學(xué)習(xí)算法AI大數(shù)據(jù)技術(shù)

        ?搜索公眾號添加:?datanlp

        長按圖片,識別二維碼




        閱讀過本文的人還看了以下文章:


        TensorFlow 2.0深度學(xué)習(xí)案例實(shí)戰(zhàn)


        基于40萬表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測


        《基于深度學(xué)習(xí)的自然語言處理》中/英PDF


        Deep Learning 中文版初版-周志華團(tuán)隊(duì)


        【全套視頻課】最全的目標(biāo)檢測算法系列講解,通俗易懂!


        《美團(tuán)機(jī)器學(xué)習(xí)實(shí)踐》_美團(tuán)算法團(tuán)隊(duì).pdf


        《深度學(xué)習(xí)入門:基于Python的理論與實(shí)現(xiàn)》高清中文PDF+源碼


        《深度學(xué)習(xí):基于Keras的Python實(shí)踐》PDF和代碼


        特征提取與圖像處理(第二版).pdf


        python就業(yè)班學(xué)習(xí)視頻,從入門到實(shí)戰(zhàn)項(xiàng)目


        2019最新《PyTorch自然語言處理》英、中文版PDF+源碼


        《21個(gè)項(xiàng)目玩轉(zhuǎn)深度學(xué)習(xí):基于TensorFlow的實(shí)踐詳解》完整版PDF+附書代碼


        《深度學(xué)習(xí)之pytorch》pdf+附書源碼


        PyTorch深度學(xué)習(xí)快速實(shí)戰(zhàn)入門《pytorch-handbook》


        【下載】豆瓣評分8.1,《機(jī)器學(xué)習(xí)實(shí)戰(zhàn):基于Scikit-Learn和TensorFlow》


        《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼


        汽車行業(yè)完整知識圖譜項(xiàng)目實(shí)戰(zhàn)視頻(全23課)


        李沐大神開源《動手學(xué)深度學(xué)習(xí)》,加州伯克利深度學(xué)習(xí)(2019春)教材


        筆記、代碼清晰易懂!李航《統(tǒng)計(jì)學(xué)習(xí)方法》最新資源全套!


        《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》最新2018版中英PDF+源碼


        將機(jī)器學(xué)習(xí)模型部署為REST API


        FashionAI服裝屬性標(biāo)簽圖像識別Top1-5方案分享


        重要開源!CNN-RNN-CTC 實(shí)現(xiàn)手寫漢字識別


        yolo3 檢測出圖像中的不規(guī)則漢字


        同樣是機(jī)器學(xué)習(xí)算法工程師,你的面試為什么過不了?


        前海征信大數(shù)據(jù)算法:風(fēng)險(xiǎn)概率預(yù)測


        【Keras】完整實(shí)現(xiàn)‘交通標(biāo)志’分類、‘票據(jù)’分類兩個(gè)項(xiàng)目,讓你掌握深度學(xué)習(xí)圖像分類


        VGG16遷移學(xué)習(xí),實(shí)現(xiàn)醫(yī)學(xué)圖像識別分類工程項(xiàng)目


        特征工程(一)


        特征工程(二) :文本數(shù)據(jù)的展開、過濾和分塊


        特征工程(三):特征縮放,從詞袋到 TF-IDF


        特征工程(四): 類別特征


        特征工程(五): PCA 降維


        特征工程(六): 非線性特征提取和模型堆疊


        特征工程(七):圖像特征提取和深度學(xué)習(xí)


        如何利用全新的決策樹集成級聯(lián)結(jié)構(gòu)gcForest做特征工程并打分?


        Machine Learning Yearning 中文翻譯稿


        螞蟻金服2018秋招-算法工程師(共四面)通過


        全球AI挑戰(zhàn)-場景分類的比賽源碼(多模型融合)


        斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


        python+flask搭建CNN在線識別手寫中文網(wǎng)站


        中科院Kaggle全球文本匹配競賽華人第1名團(tuán)隊(duì)-深度學(xué)習(xí)與特征工程



        不斷更新資源

        深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、python

        ?搜索公眾號添加:?datayx??



        瀏覽 103
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        評論
        圖片
        表情
        推薦
        點(diǎn)贊
        評論
        收藏
        分享

        手機(jī)掃一掃分享

        分享
        舉報(bào)
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            久久精品国产亚洲aⅴ瑜伽 | 欧美精品成人在线 | 日本色综合 | 一起艹网站 | 黄色三级片视频网站 | 太粗大了潘金莲受不了1一一 | 日韩精品一二三四 | 色色干干 | 主人调教女m跪趴sm视频 | 久久久性视频 |