1. <strong id="7actg"></strong>
    2. <table id="7actg"></table>

    3. <address id="7actg"></address>
      <address id="7actg"></address>
      1. <object id="7actg"><tt id="7actg"></tt></object>

        一張圖了解機器學習

        共 2711字,需瀏覽 6分鐘

         ·

        2021-11-14 09:48

        來源:DeepHub IMBA

        本文約2300字,建議閱讀8分鐘?

        本文介紹了機器學習的種類。


        機器學習


        機器學習是人工智能(AI)的一種應用,為系統(tǒng)提供無需明確編程就能根據(jù)經(jīng)驗自動學習和改進的能力。

        機器學習根據(jù)不同的任務類型可以分為以下三大類型:

        • 有監(jiān)督學習

        • 無監(jiān)督學習

        • 強化學習




        有監(jiān)督學習


        監(jiān)督學習是一種機器學習任務,通過訓練學習一個函數(shù),該函數(shù)根據(jù)示例輸入-輸出對將輸入映射到輸出。(需要數(shù)據(jù)標注,輸入->輸出)

        在這種類型中,機器學習算法是在標記數(shù)據(jù)上訓練的。盡管這種方法需要準確地標記數(shù)據(jù),但在適當?shù)那闆r下使用監(jiān)督學習是非常有效的。

        開始時,系統(tǒng)接收輸入數(shù)據(jù)和輸出數(shù)據(jù)。它的任務是創(chuàng)建適當?shù)囊?guī)則,將輸入映射到輸出。訓練過程應該持續(xù),直到表現(xiàn)水平足夠高為止。

        在訓練之后,系統(tǒng)應該能夠分配一個在訓練階段沒有看到的輸出對象。在大多數(shù)情況下,這個過程是非常快速和準確的。

        監(jiān)督學習的類型:

        • Regression:回歸,輸出是連續(xù)值

        • Classification:分類,輸出是離散值


        回歸

        回歸是一種有監(jiān)督的機器學習技術,用于預測連續(xù)值。例如,我們可以用它來預測某種產(chǎn)品的價格,比如某個城市的房價或股票的價值。

        機器學習中的回歸由數(shù)學方法組成,數(shù)據(jù)科學家可以根據(jù)一個或多個預測變量(x)的值預測一個連續(xù)的結果(y)。線性回歸可能是回歸分析中最流行的形式,因為它在預測和預測中很容易使用。

        分類

        分類是一種旨在重現(xiàn)類別分配的技術。它可以預測響應值,并將數(shù)據(jù)分成“類”。例如識別照片中的汽車類型,鑒別垃圾郵件,檢測表情,人臉識別等等。

        分類的三種主要類型是:

        • 二元分類 Binary Classification


        它是分類的過程或任務,其中將給定的數(shù)據(jù)分為兩類。它基本上是一種關于事物屬于兩個群體中的哪一個的預測。

        假設有兩封電子郵件發(fā)送給您,一封是由不斷發(fā)送廣告的保險公司發(fā)送的,另一封是您的銀行發(fā)送的關于您的信用卡賬單的電子郵件。

        電子郵件服務提供商將對兩封電子郵件進行分類,第一封將發(fā)送到垃圾郵件文件夾,第二封將保留在主郵件中。這個過程被稱為二元分類,因為有兩個離散的類,一個是垃圾郵件,另一個不是垃圾郵件的。所以這是一個二元分類的問題。

        算法:

        • 邏輯回歸

        • KNN

        • 決策樹/隨機森林/提升樹

        • 支持向量機 SVM

        • 樸素貝葉斯

        • 多層感知機


        • 多分類 Multi-class Classification


        多類分類是指那些具有兩個以上類標簽,但是輸入數(shù)據(jù)只對應一個類標簽的分類任務。

        算法:

        • KNN

        • 決策樹/隨機森林/提升樹

        • 樸素貝葉斯

        • 多層感知機


        注:這里去掉了SVM和邏輯回歸,因為他們只支持二分類,但是可以通過其他方法實現(xiàn)多分類,一般情況下會構建與分類數(shù)相同的模型并進行二元分類,比如數(shù)字識別0-9,SVM會訓練10個二元模型,分別判斷是否是1,是否是2,邏輯回歸也是同理。


        • 多標簽分類 Multi-Label Classification


        多標簽分類是指那些具有兩個或多個類標簽的分類任務,其中每個示例可以預測一個或多個類標簽。

        多分類可以叫做單標簽多分類,是一對一的關系,而多標簽分類是一對多的關系。

        通俗的講,一張照片里面有貓和狗,如果使用多分類來說,他只能將照片分成1類,貓或狗(一對一),但是對于多標簽來說,會同時輸出貓和夠(一對多)

        無監(jiān)督學習


        無監(jiān)督學習是指使用人工智能 (AI) 算法來識別包含未標記的數(shù)據(jù)點的數(shù)據(jù)集中的模式。在訓練時算法對包含在數(shù)據(jù)集中的數(shù)據(jù)點進行分類、標記和/或分組,在執(zhí)行訓練時無需任何外部指導。換句話說無監(jiān)督學習允許系統(tǒng)自行識別數(shù)據(jù)集中的模式。在無監(jiān)督學習中,即使沒有提供任何的期望輸出模型也會根據(jù)異同對信息進行分組。

        無監(jiān)督學習算法可以執(zhí)行比監(jiān)督學習系統(tǒng)更復雜的處理任務。

        無監(jiān)督學習的類型:

        A.聚類

        聚類是指自動將具有相似特征的數(shù)據(jù)點組合在一起并將它們分配給“簇”的過程。

        常用算法:

        • K-Means(K均值)

        • DBSCAN

        • 使用高斯混合模型(GMM)


        B.關聯(lián)

        關聯(lián)規(guī)則學習是一種無監(jiān)督學習技術,它在大型數(shù)據(jù)中檢查一個數(shù)據(jù)項對另一個數(shù)據(jù)項的依賴性 ,它試圖在數(shù)據(jù)集的變量之間找到一些有趣的關系或關聯(lián)。根據(jù)不同的規(guī)則來發(fā)現(xiàn)數(shù)據(jù)中變量之間的有趣關系。

        常用算法:

        • Apriori算法

        • PCY算法

        • FP-Tree算法

        • XFP-Tree算法

        • GPApriori算法

        應用:

        市場分析:是關聯(lián)規(guī)則挖掘的流行示例和應用之一。大型零售商通常使用這種技術來確定商品之間的關聯(lián)。(啤酒尿布)

        醫(yī)學診斷:關聯(lián)規(guī)則有助于識別特定疾病的患病概率。

        蛋白質(zhì)序列:關聯(lián)規(guī)則有助于確定人工蛋白質(zhì)的合成。

        強化學習


        強化學習 (RL) 是一種機器學習技術,它使代理通在交互式環(huán)境中通過來自其自身行為和經(jīng)驗的反饋進行學習。

        盡管監(jiān)督學習和強化學習都使用輸入和輸出之間的映射,但與向代理提供的反饋是執(zhí)行任務的正確動作集的監(jiān)督學習不同,強化學習使用獎勵和懲罰作為積極和消極行為的信號。

        與無監(jiān)督學習相比,強化學習在目標方面有所不同。雖然無監(jiān)督學習的目標是找到數(shù)據(jù)點之間的異同,但在強化學習的情況下,目標是找到一個合適的動作模型,使代理的總累積獎勵最大化。


        描述 RL 問題基本要素的一些關鍵術語是:

        1. 環(huán)境Environment ——代理運行的物理世界
        2. 代理Agent ——也叫智能體,就是我們所寫的算法
        3. 行動Action——代理產(chǎn)生的動作
        4. 狀態(tài)State——代理的狀態(tài)
        5. 獎勵Reward——來自環(huán)境的反饋,好的還是壞的
        6. 策略Policy ——將代理的狀態(tài)映射到動作的方法,通過狀態(tài)選擇做什么行動
        7. 價值Value ——代理在特定狀態(tài)下采取行動將獲得的未來獎勵


        deephub譯者注


        機器學習可以根據(jù)不同的分類方法分成不同的類型,例如本文是根據(jù)任務類型來進行區(qū)分的大類,例如我們常見的,圖像分割其實就是對于圖片像素級別的分類任務,而目標檢測主要的目標就是邊框的回歸。

        對于實現(xiàn)的方法,我們還可以根據(jù)模型分成不同的實現(xiàn)方法,例如:

        • 傳統(tǒng)的機器學習:各種回歸

        • 核方法:SVM等

        • 貝葉斯模型:概率相關

        • 樹型模型:決策樹、隨機森林、各種boosting

        • 神經(jīng)網(wǎng)絡:多層感知機、各種NN


        以上分類并不沖突并且是交叉的。最簡單的就是我們在使用神經(jīng)網(wǎng)絡分類和回歸的時候,最后一層一般都會使用線性層(有的也叫稠密層)這一層使用的算法就是線性回歸,再例如我們也可以使用神經(jīng)網(wǎng)絡來進行聚類算法,比如deepCluster。

        編輯:王菁
        校對:龔力

        瀏覽 97
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        評論
        圖片
        表情
        推薦
        點贊
        評論
        收藏
        分享

        手機掃一掃分享

        分享
        舉報
        1. <strong id="7actg"></strong>
        2. <table id="7actg"></table>

        3. <address id="7actg"></address>
          <address id="7actg"></address>
          1. <object id="7actg"><tt id="7actg"></tt></object>
            一级特黄60分钟兔费 | 欧美日本视频在线 | 中文字幕在线观看免费 | 一级淫乱视频 | 日韩在线观看av 精品在线99 | 91黄色免费看 | 日韩一级在线播放免费观看 | 亚洲欧美视频在线观看 | 国内精品国产成人三级 | 农村妇女av |