1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        比監(jiān)督學習做的更好:半監(jiān)督學習

        共 3495字,需瀏覽 7分鐘

         ·

        2021-09-14 15:32









        點擊上方小白學視覺”,選擇加"星標"或“置頂

        重磅干貨,第一時間送達

        本文轉(zhuǎn)自|機器學習算法那些事
        導讀

        為什么半監(jiān)督學習是機器學習的未來。


        監(jiān)督學習是人工智能領域的第一種學習類型。從它的概念開始,無數(shù)的算法,從簡單的邏輯回歸到大規(guī)模的神經(jīng)網(wǎng)絡,都已經(jīng)被研究用來提高精確度和預測能力。

        然而,一個重大突破揭示了添加“無監(jiān)督數(shù)據(jù)”可以提高模型泛化和性能。事實上,在非常多的場景中,帶有標簽的數(shù)據(jù)并不容易獲得。半監(jiān)督學習可以在標準的任務中實現(xiàn)SOTA的效果,只需要一小部分的有標記數(shù)據(jù) —— 數(shù)百個訓練樣本。

        在這個我們對半監(jiān)督學習的探索中,我們會有:

        1. 半監(jiān)督學習簡介。什么是半監(jiān)督學習,它與其他學習方法相比如何,半監(jiān)督學習算法的框架/思維過程是什么?
        2. 算法:Semi-Supervised GANs。與傳統(tǒng)GANs的比較,過程的解釋,半監(jiān)督GANs的性能。
        3. 用例和機器學習的未來。為什么半監(jiān)督學習會有如此大的需求,哪里可以應用。


        半監(jiān)督學習介紹


        半監(jiān)督學習算法代表了監(jiān)督和非監(jiān)督算法的中間地帶。雖然沒有正式定義為機器學習的“第四個”元素(監(jiān)督、無監(jiān)督、強化),但它將前兩個方面結(jié)合成一種自己的方法。

        這些算法操作的數(shù)據(jù)有一些標簽,但大部分是沒有標簽的。傳統(tǒng)上,人們要么選擇有監(jiān)督學習的方式,只對帶有標簽的數(shù)據(jù)進行操作,這將極大地減小數(shù)據(jù)集的規(guī)模,要么,就會選擇無監(jiān)督學習的方式,丟棄標簽保留數(shù)據(jù)集的其余部分,然后做比如聚類之類的工作。


        這在現(xiàn)實世界中是很常見的。由于標注是很昂貴的,特別是大規(guī)模數(shù)據(jù)集,特別是企業(yè)用途的,可能只有幾個標簽。例如,考慮確定用戶活動是否具有欺詐性。在100萬用戶中,該公司知道有1萬用戶是這樣的,但其他9萬用戶可能是惡意的,也可能是良性的。半監(jiān)督學習允許我們操作這些類型的數(shù)據(jù)集,而不必在選擇監(jiān)督學習或非監(jiān)督學習時做出權(quán)衡。

        一般來說,半監(jiān)督學習算法在這個框架上運行:

        1. 半監(jiān)督機器學習算法使用有限的標記樣本數(shù)據(jù)集來訓練自己,從而形成一個“部分訓練”的模型。
        2. 部分訓練的模型對未標記的數(shù)據(jù)進行標記。由于樣本標記數(shù)據(jù)集有許多嚴重的限制(例如,在現(xiàn)實數(shù)據(jù)中的選擇偏差),標記的結(jié)果被認為是“偽標簽”數(shù)據(jù)。
        3. 結(jié)合標記和偽標簽數(shù)據(jù)集,創(chuàng)建一個獨特的算法,結(jié)合描述和預測方面的監(jiān)督和非監(jiān)督學習。

        半監(jiān)督學習利用分類過程來識別數(shù)據(jù)資產(chǎn),利用聚類過程將其分成不同的部分。


        算法:Semi-Supervised GAN


        半監(jiān)督的GAN,簡稱為SGAN,是[生成對抗網(wǎng)絡](https://medium.com/analytics-vidhya/gans-for-one -an-直覺解釋-革命概念-2f962c858b95)架構(gòu)的一個變體,用于解決半監(jiān)督學習問題。

        在傳統(tǒng)的GAN中,判別器被訓練來預測由生成器模型生成的圖像是真實的還是假的,允許它從圖像中學習判別特征,即使沒有標簽。盡管大多數(shù)人通常在GANs中使用訓練很好的生成器,可以生成和數(shù)據(jù)集中相似的圖像,判別器還是可以通過以轉(zhuǎn)移學習作為起點在相同的數(shù)據(jù)集上建立分類器,允許監(jiān)督任務從無監(jiān)督訓練中受益。由于大部分的圖像特征已經(jīng)被學習,因此進行分類的訓練時間和準確率會更好。

        然而,在SGAN中,判別器同時接受兩種模式的訓練:無監(jiān)督和監(jiān)督。

        • 在無監(jiān)督模式中,需要區(qū)分真實圖像和生成的圖像,就像在傳統(tǒng)的GAN中一樣。
        • 在監(jiān)督模式中,需要將一幅圖像分類為幾個類,就像在標準的神經(jīng)網(wǎng)絡分類器中一樣。

        為了同時訓練這兩種模式,判別器必須輸出1 + n個節(jié)點的值,其中1表示“真或假”節(jié)點,n是預測任務中的類數(shù)。

        在半監(jiān)督GAN中,對判別器模型進行更新,預測K+1個類,其中K為預測問題中的類數(shù),并為一個新的“”類添加額外的類標簽。它涉及到同時訓練無監(jiān)督分類任務和有監(jiān)督分類任務的判別器模型。整個數(shù)據(jù)集都可以通過SGAN進行傳遞 —— 當一個訓練樣本有標簽時,判別器的權(quán)值將被調(diào)整,否則,分類任務將被忽略,判別器將調(diào)整權(quán)值以更好地區(qū)分真實的圖像和生成的圖像。

        雖然允許SGAN進行無監(jiān)督訓練,允許模型從一個非常大的未標記數(shù)據(jù)集中學習非常有用的特征提取,但有監(jiān)督學習允許模型利用提取的特征并將其用于分類任務。其結(jié)果是一個分類器可以在像MNIST這樣的標準問題上取得令人難以置信的結(jié)果,即使是在非常非常少的標記樣本(數(shù)十到數(shù)百個)上進行訓練。

        SGAN巧妙地結(jié)合了無監(jiān)督和監(jiān)督學習的方面,強強聯(lián)合,以最小的標簽量,產(chǎn)生難以置信的結(jié)果。


        用例和機器學習的未來

        在一個可用數(shù)據(jù)量呈指數(shù)級增長的時代,無監(jiān)督數(shù)據(jù)根本不能停下來等待標注。無數(shù)真實世界的數(shù)據(jù)場景會像這樣出現(xiàn) —— 例如,YouTube視頻或網(wǎng)站內(nèi)容。從爬蟲引擎和內(nèi)容聚合系統(tǒng)到圖像和語音識別,半監(jiān)督學習被廣泛應用。

        半監(jiān)督學習將監(jiān)督學習和非監(jiān)督學習的過擬合和“不擬合”傾向(分別)結(jié)合起來的能力,創(chuàng)建了一個模型,在給出最小數(shù)量的標記數(shù)據(jù)和大量的未標記數(shù)據(jù)的情況下,可以出色地執(zhí)行分類任務。除了分類任務,半監(jiān)督算法還有許多其他用途,如增強聚類和異常檢測。盡管這一領域本身相對較新,但由于在當今的數(shù)字領域中發(fā)現(xiàn)了巨大的需求,算法一直在不斷地被創(chuàng)造和完善。

        半監(jiān)督學習確實是機器學習的未來。

        好消息,小白學視覺團隊的知識星球開通啦,為了感謝大家的支持與厚愛,團隊決定將價值149元的知識星球現(xiàn)時免費加入。各位小伙伴們要抓住機會哦!


        下載1:OpenCV-Contrib擴展模塊中文版教程
        在「小白學視覺」公眾號后臺回復:擴展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴展模塊教程中文版,涵蓋擴展模塊安裝、SFM算法、立體視覺、目標跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。

        下載2:Python視覺實戰(zhàn)項目52講
        小白學視覺公眾號后臺回復:Python視覺實戰(zhàn)項目,即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個視覺實戰(zhàn)項目,助力快速學校計算機視覺。

        下載3:OpenCV實戰(zhàn)項目20講
        小白學視覺公眾號后臺回復:OpenCV實戰(zhàn)項目20講,即可下載含有20個基于OpenCV實現(xiàn)20個實戰(zhàn)項目,實現(xiàn)OpenCV學習進階。

        交流群


        歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器、自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學影像、GAN算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進入相關微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~




        一、

        二、

        三、

        好消息,小白學視覺團隊的知識星球開通啦,為了感謝大家的支持與厚愛,團隊決定將價值149元的知識星球現(xiàn)時免費加入。各位小伙伴們要抓住機會哦!


        下載1:OpenCV-Contrib擴展模塊中文版教程
        在「小白學視覺」公眾號后臺回復:擴展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴展模塊教程中文版,涵蓋擴展模塊安裝、SFM算法、立體視覺、目標跟蹤、生物視覺、超分辨率處理等二十多章內(nèi)容。

        下載2:Python視覺實戰(zhàn)項目52講
        小白學視覺公眾號后臺回復:Python視覺實戰(zhàn)項目即可下載包括圖像分割、口罩檢測、車道線檢測、車輛計數(shù)、添加眼線、車牌識別、字符識別、情緒檢測、文本內(nèi)容提取、面部識別等31個視覺實戰(zhàn)項目,助力快速學校計算機視覺。

        下載3:OpenCV實戰(zhàn)項目20講
        小白學視覺公眾號后臺回復:OpenCV實戰(zhàn)項目20講,即可下載含有20個基于OpenCV實現(xiàn)20個實戰(zhàn)項目,實現(xiàn)OpenCV學習進階。

        交流群


        歡迎加入公眾號讀者群一起和同行交流,目前有SLAM、三維視覺、傳感器自動駕駛、計算攝影、檢測、分割、識別、醫(yī)學影像、GAN、算法競賽等微信群(以后會逐漸細分),請掃描下面微信號加群,備注:”昵稱+學校/公司+研究方向“,例如:”張三 + 上海交大 + 視覺SLAM“。請按照格式備注,否則不予通過。添加成功后會根據(jù)研究方向邀請進入相關微信群。請勿在群內(nèi)發(fā)送廣告,否則會請出群,謝謝理解~


        瀏覽 47
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            久久久久久久久久久久久久电影 | 女人一级片 | 鲁丝片一区二区三区 | 高跟91娇喘 | 东北老女人操逼视频 | 亚洲综合第一 | 亚洲国产精品久久久 | 国产伦精品一区二区三区四区视频 | 一级黄片在线 | 成人自拍偷拍网 |