導(dǎo)讀:本文將討論監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)這三種類型的機(jī)器學(xué)習(xí)。
作者:塞巴斯蒂安·拉施卡(Sebastian Raschka)、瓦希德·米爾賈利利(Vahid Mirjalili)來源:大數(shù)據(jù)DT(ID:hzdashuju)了解三者之間的根本差別,并通過概念性的示例,我們將形成可應(yīng)用于實(shí)際問題領(lǐng)域的見解,如圖1-1所示。
01 用監(jiān)督學(xué)習(xí)預(yù)測未來監(jiān)督學(xué)習(xí)的主要目標(biāo)是從有標(biāo)簽的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)模型,以便對(duì)未知或未來的數(shù)據(jù)做出預(yù)測。在這里“監(jiān)督”一詞指的是已經(jīng)知道訓(xùn)練樣本(輸入數(shù)據(jù))中期待的輸出信號(hào)(標(biāo)簽)。圖1-2總結(jié)了一個(gè)典型的監(jiān)督學(xué)習(xí)流程,先為機(jī)器學(xué)習(xí)算法提供打過標(biāo)簽的訓(xùn)練數(shù)據(jù)以擬合預(yù)測模型,然后用該模型對(duì)未打過標(biāo)簽的新數(shù)據(jù)進(jìn)行預(yù)測。
以垃圾郵件過濾為例,可以采用監(jiān)督機(jī)器學(xué)習(xí)算法在打過標(biāo)簽的(正確標(biāo)識(shí)垃圾與非垃圾)電子郵件的語料庫上訓(xùn)練模型,然后用該模型來預(yù)測新郵件是否屬于垃圾郵件。帶有離散分類標(biāo)簽的監(jiān)督學(xué)習(xí)任務(wù)也被稱為分類任務(wù),例如上述的垃圾電子郵件過濾示例。監(jiān)督學(xué)習(xí)的另一個(gè)子類被稱為回歸,其結(jié)果信號(hào)是連續(xù)的數(shù)值。分類是監(jiān)督學(xué)習(xí)的一個(gè)分支,其目的是根據(jù)過去的觀測結(jié)果來預(yù)測新樣本的分類標(biāo)簽。這些分類標(biāo)簽是離散的無序值,可以理解為樣本的組成員關(guān)系。前面提到的郵件垃圾檢測就是典型的二元分類任務(wù),機(jī)器學(xué)習(xí)算法學(xué)習(xí)規(guī)則以區(qū)分垃圾和非垃圾郵件。圖1-3將通過30個(gè)訓(xùn)練樣本闡述二元分類任務(wù)的概念,其中15個(gè)標(biāo)簽為負(fù)類(-),另外15個(gè)標(biāo)簽為正類(+)。該數(shù)據(jù)集為二維,這意味著每個(gè)樣本都與x1和x2的值相關(guān)?,F(xiàn)在,可以通過監(jiān)督機(jī)器學(xué)習(xí)算法來學(xué)習(xí)一個(gè)規(guī)則——用一條虛線來表示決策邊界——區(qū)分兩類數(shù)據(jù),并根據(jù)x1和x2的值為新數(shù)據(jù)分類。
但是,類標(biāo)簽集并非都是二元的。經(jīng)過監(jiān)督學(xué)習(xí)算法學(xué)習(xí)所獲得的預(yù)測模型可以將訓(xùn)練數(shù)據(jù)集中出現(xiàn)過的任何維度的類標(biāo)簽分配給尚未打標(biāo)簽的新樣本。多類分類任務(wù)的典型示例是手寫字符識(shí)別。首先,收集包含字母表中所有字母的多個(gè)手寫示例所形成的訓(xùn)練數(shù)據(jù)集。字母(“A”“B”“C”等)代表我們要預(yù)測的不同的無序類別或類標(biāo)簽。然后,當(dāng)用戶通過輸入設(shè)備提供新的手寫字符時(shí),預(yù)測模型能夠以某一準(zhǔn)確率將其識(shí)別為字母表中的正確字母。然而,該機(jī)器學(xué)習(xí)系統(tǒng)卻無法正確地識(shí)別0到9之間的任何數(shù)字,因?yàn)樗鼈儾⒉皇怯?xùn)練數(shù)據(jù)集中的一部分。2. 用于預(yù)測連續(xù)結(jié)果的回歸上一節(jié)學(xué)習(xí)到分類任務(wù)是為樣本分配無序的分類標(biāo)簽。第二類監(jiān)督學(xué)習(xí)是對(duì)連續(xù)結(jié)果的預(yù)測,也稱為回歸分析?;貧w分析包括一些預(yù)測(解釋)變量和一個(gè)連續(xù)的響應(yīng)變量(結(jié)果),試圖尋找那些變量之間的關(guān)系,從而能夠讓我們預(yù)測結(jié)果。注意,機(jī)器學(xué)習(xí)領(lǐng)域的預(yù)測變量通常被稱為“特征”,而響應(yīng)變量通常被稱為“目標(biāo)變量”。以預(yù)測學(xué)生SAT數(shù)學(xué)成績?yōu)槔?。假設(shè)學(xué)習(xí)時(shí)間與考試成績相關(guān),以此為訓(xùn)練數(shù)據(jù)通過機(jī)器學(xué)習(xí)建模,用將來打算參加該項(xiàng)考試學(xué)生的學(xué)習(xí)時(shí)間來預(yù)測其考試成績。- 1886年,F(xiàn)rancis Galton在其論文Regression towards Mediocrity in Hereditary Stature中首次提到回歸一詞。Galton描述了一種生物學(xué)現(xiàn)象,即種群身高的變化不會(huì)隨時(shí)間的推移而增加。
他觀察到父母的身高不會(huì)遺傳給自己的孩子,相反,孩子的身高會(huì)回歸到總體均值。圖1-4說明了線性回歸的概念。給定特征變量x和目標(biāo)變量y,對(duì)數(shù)據(jù)進(jìn)行線性擬合,最小化樣本點(diǎn)和擬合線之間的距離——最常用的平均平方距離。
現(xiàn)在可以用從該數(shù)據(jù)中學(xué)習(xí)到的截距和斜率來預(yù)測新數(shù)據(jù)的目標(biāo)變量。02 用強(qiáng)化學(xué)習(xí)解決交互問題另一類機(jī)器學(xué)習(xí)是強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)的目標(biāo)是開發(fā)一個(gè)系統(tǒng)(智能體),通過與環(huán)境的交互來提高其性能。當(dāng)前環(huán)境狀態(tài)的信息通常包含所謂的獎(jiǎng)勵(lì)信號(hào),可以把強(qiáng)化學(xué)習(xí)看作一個(gè)與監(jiān)督學(xué)習(xí)相關(guān)的領(lǐng)域。然而強(qiáng)化學(xué)習(xí)的反饋并非標(biāo)定過的正確標(biāo)簽或數(shù)值,而是獎(jiǎng)勵(lì)函數(shù)對(duì)行動(dòng)度量的結(jié)果。智能體可以與環(huán)境交互完成強(qiáng)化學(xué)習(xí),并通過探索性的試錯(cuò)或深思熟慮的規(guī)劃來最大化這種獎(jiǎng)勵(lì)。強(qiáng)化學(xué)習(xí)的常見示例是國際象棋。智能體根據(jù)棋盤的狀態(tài)或環(huán)境來決定一系列的行動(dòng),獎(jiǎng)勵(lì)定義為比賽的輸或贏,如圖1-5所示。
強(qiáng)化學(xué)習(xí)有許多不同的子類。然而,一般模式是強(qiáng)化學(xué)習(xí)智能體試圖通過與環(huán)境的一系列交互來最大化獎(jiǎng)勵(lì)。每種狀態(tài)都可以與正或負(fù)的獎(jiǎng)勵(lì)相關(guān)聯(lián),獎(jiǎng)勵(lì)可以被定義為完成一個(gè)總目標(biāo),如贏棋或輸棋。例如國際象棋每走一步的結(jié)果都可以認(rèn)為是環(huán)境的一個(gè)不同狀態(tài)。為進(jìn)一步探索國際象棋的示例,觀察一下棋盤上與贏棋相關(guān)聯(lián)的某些狀況,比如吃掉對(duì)手的棋子或威脅皇后。也注意一下棋盤上與輸棋相關(guān)聯(lián)的狀態(tài),例如在接下來的回合中輸給對(duì)手一個(gè)棋子。下棋只有到了結(jié)束的時(shí)候才會(huì)得到獎(jiǎng)勵(lì)(無論是正面的贏棋還是負(fù)面的輸棋)。另外,最終的獎(jiǎng)勵(lì)也取決于對(duì)手的表現(xiàn)。例如,對(duì)手可能犧牲了皇后,但最終贏棋了。強(qiáng)化學(xué)習(xí)涉及根據(jù)學(xué)習(xí)一系列的行動(dòng)來最大化總體獎(jiǎng)勵(lì),這些獎(jiǎng)勵(lì)可能即時(shí)獲得,也可能延后獲得。03 用無監(jiān)督學(xué)習(xí)發(fā)現(xiàn)隱藏的結(jié)構(gòu)監(jiān)督學(xué)習(xí)訓(xùn)練模型時(shí),事先知道正確的答案;在強(qiáng)化學(xué)習(xí)的過程中,定義了智能體對(duì)特定行動(dòng)的獎(jiǎng)勵(lì)。然而,無監(jiān)督學(xué)習(xí)處理的是無標(biāo)簽或結(jié)構(gòu)未知的數(shù)據(jù)。用無監(jiān)督學(xué)習(xí)技術(shù),可以在沒有已知結(jié)果變量或獎(jiǎng)勵(lì)函數(shù)的指導(dǎo)下,探索數(shù)據(jù)結(jié)構(gòu)來提取有意義的信息。聚類是探索性的數(shù)據(jù)分析技術(shù),可以在事先不了解成員關(guān)系的情況下,將信息分成有意義的子群(集群)。為在分析過程中出現(xiàn)的每個(gè)集群定義一組對(duì)象,集群的成員之間具有一定程度的相似性,但與其他集群中對(duì)象的差異性較大,這就是為什么聚類有時(shí)也被稱為無監(jiān)督分類。聚類是一種構(gòu)造信息和從數(shù)據(jù)中推導(dǎo)出有意義關(guān)系的有用技術(shù)。例如,它允許營銷人員根據(jù)自己的興趣發(fā)現(xiàn)客戶群,以便制定不同的市場營銷計(jì)劃。圖1-6解釋了如何應(yīng)用聚類把無標(biāo)簽數(shù)據(jù)根據(jù)x1和x2的相似性分成三組。
無監(jiān)督學(xué)習(xí)的另一個(gè)子類是降維。我們經(jīng)常要面對(duì)高維數(shù)據(jù)。高維數(shù)據(jù)的每個(gè)觀察通常都伴隨著大量的測量數(shù)據(jù),這對(duì)有限的存儲(chǔ)空間和機(jī)器學(xué)習(xí)算法的計(jì)算性能提出了挑戰(zhàn)。無監(jiān)督降維是特征預(yù)處理中一種常用的數(shù)據(jù)去噪方法,不僅可以降低某些算法對(duì)預(yù)測性能的要求,而且可以在保留大部分相關(guān)信息的同時(shí)將數(shù)據(jù)壓縮到較小維數(shù)的子空間上。有時(shí)降維有利于數(shù)據(jù)的可視化,例如,為了通過二維散點(diǎn)圖、三維散點(diǎn)圖或直方圖實(shí)現(xiàn)數(shù)據(jù)的可視化,可以把高維特征數(shù)據(jù)集映射到一維、二維或三維特征空間。圖1-7展示了一個(gè)采用非線性降維將三維瑞士卷壓縮成新的二維特征子空間的示例。
關(guān)于作者:塞巴斯蒂安·拉施卡(Sebastian Raschka),密歇根州立大學(xué)博士,他在計(jì)算生物學(xué)領(lǐng)域提出了幾種新的計(jì)算方法,還被科技博客Analytics Vidhya評(píng)為GitHub上最具影響力的數(shù)據(jù)科學(xué)家。
瓦希德·米爾賈利利(Vahid Mirjalili),密歇根州立大學(xué)計(jì)算機(jī)視覺與機(jī)器學(xué)習(xí)研究員,致力于把機(jī)器學(xué)習(xí)應(yīng)用到各種計(jì)算機(jī)視覺研究項(xiàng)目。他在學(xué)術(shù)和研究生涯中積累了豐富的Python編程經(jīng)驗(yàn),其主要研究興趣為深度學(xué)習(xí)和計(jì)算機(jī)視覺應(yīng)用。
本文摘編自《Python機(jī)器學(xué)習(xí)(原書第3版)》,經(jīng)出版方授權(quán)發(fā)布。延伸閱讀《Python機(jī)器學(xué)習(xí)(原書第3版)》推薦語:本書自第1版出版以來,備受廣大讀者歡迎。與同類書相比,本書除了介紹如何用Python和基于Python的機(jī)器學(xué)習(xí)軟件庫進(jìn)行實(shí)踐外,還對(duì)機(jī)器學(xué)習(xí)概念的必要細(xì)節(jié)進(jìn)行討論,同時(shí)對(duì)機(jī)器學(xué)習(xí)算法的工作原理、使用方法以及如何避免掉入常見的陷阱提供直觀且翔實(shí)的解釋,是Python機(jī)器學(xué)習(xí)入門必讀之作。
(點(diǎn)擊標(biāo)題可跳轉(zhuǎn)閱讀)
老鐵,三連支持一下,好嗎?↓↓↓