筆記|李宏毅老師機器學習課程,視頻1機器學習的簡介
《學習筆記》專欄·第1篇
文 | MLer
1375字 | 4分鐘閱讀
【數(shù)據(jù)科學與人工智能】開通了機器學習群,大家可以相互學習和交流。請掃描下方二維碼,備注:姓名-ML,添加我為好友,誠邀你入群,一起進步。
感謝李宏毅老師的分享,他的課程幫助我更好地學習、理解和應用機器學習。李老師的網(wǎng)站:http://speech.ee.ntu.edu.tw/~tlkagk/index.html。這個學習筆記是根據(jù)李老師2017年秋季機器學習課程的視頻和講義做的記錄和總結。因為這個視頻是在Youtube上面,有些朋友可能無法觀看,我把它搬運下來放在云盤上面,大家點擊閱讀原文,就可以直接在手機隨時隨地觀看了。再次,感謝李老師的付出和貢獻。
這門課,共有36個視頻,每個視頻播放的時間不一。我按著視頻播放的順序,觀看,聆聽和學習,并結合講義,做學習筆記。我做學習筆記目的有三:
1 幫助自己學習和理解機器學習
2 記錄機器學習的重要知識、方法、原理和思想
3 為傳播機器學習做點事情
視頻1:機器學習簡介
一、AI、ML和DL的關系
正如李老師所講,AI是目標,ML是一種AI手段,DL是一種ML方法。

二、機器學習是什么?
李老師說,機器學習約等于從數(shù)據(jù)中尋找一個函數(shù)。

例如:語音識別、圖像識別、Playing Go、對話系統(tǒng)等
三、如何找到這個Function?
機器學習的框架
三部曲
第一步:定義和設計函數(shù)集(Function set)
第二步:判斷函數(shù)的好壞(Goodness of function)
第三步:找到一個最佳的函數(shù)(Best function)

這個三部曲,也可以看做為機器學習的表達式、目標函數(shù)和優(yōu)化策略。
你會發(fā)現(xiàn),機器學習很簡單,如下圖所示:

這個時候,我會想到這些問題:
1 這個函數(shù)集怎么定義或者表達呢?
2 如何評價一個函數(shù)的好壞,利用目標函數(shù)來做這個事情,也就是說,一個目標函數(shù)是第一步函數(shù)集中定義的函數(shù)的函數(shù),它是一個復合函數(shù),這個復合函數(shù)怎么設計?
3 如何根據(jù)第二步,從函數(shù)集里面找到最佳的函數(shù)呢?
四、課程的學習地圖
第一:回歸任務,以預測天氣PM2.5的值為例
第二:分類任務
分類與回歸的差異,在于輸出的類型不一樣,前者是類別(二個或者多個),后者是一串數(shù)值。
分類分為二元分類和多元分類
例如:垃圾郵件識別系統(tǒng),是否為垃圾郵件,二元分類;文檔分類系統(tǒng),輸出新聞所屬的類別(政治類、經(jīng)濟類、體育類等)
我們要完成任務,需要采用各種方法,簡單方法,有線性方法Linear Model,與之對應的有非線性方法Non-linear Model,非線性模型,例如,決策樹、KNN、SVM、深度學習等
回歸任務和分類任務,統(tǒng)稱為有監(jiān)督學習,在訓練階段,需要提供正確的輸出(Label)。實際情況中,收集大量的帶有正確Label的數(shù)據(jù)集是非常困難的,有時候也會非常的昂貴。比方說,金融領域的里面,好人和壞人的標簽。針對這些問題,出現(xiàn)了新的機器學習范式,比方說半監(jiān)督學習、遷移學習或者無監(jiān)督學習。
李老師,還提到了一種結構學習的任務,既不屬于回歸任務,又不屬于分類任務,這個任務更有挑戰(zhàn)性,意味有很多問題待思考和解決。
有監(jiān)督學習,從教師指導下學習;而強化學習,從交互評價下學習。
李老師以訓練一個聊天機器人為例,對比說明了監(jiān)督學習和強化學習的兩種不同學習模式和差異。
總之,這個學習地圖,包括場景-任務-方法(算法與模型),如下圖所示:

朋友們,在學習中有什么問題或者想法,請加入機器學習群,大家一起討論,共同進步。
每周一書
5數(shù)據(jù)科學導論:Python語言實現(xiàn)
