機器學習入門課程怎么選?網(wǎng)上熱門課程測評來了?。?!
引言
機器學習是一門涉及概率論、統(tǒng)計學、逼近論、凸分析、算法復雜度理論等多門學科的多3領(lǐng)域交叉學科,在當下各個領(lǐng)域運用十分廣泛。不僅是業(yè)內(nèi)人士,許多業(yè)外人士為了豐富自己的知識涉獵領(lǐng)域,提升自身競爭力,也或多或少的開始嘗試接觸機器學習。但是對于初學者來說,選擇一個真正適合自己的課程,往往是一個令人頭大的問題。
在這篇文章中我總結(jié)了四個網(wǎng)上比較受歡迎的課程,在講師、課程內(nèi)容、亮點、局限性、課程難度、建議基礎(chǔ)知識幾個方面進行了對比,希望對大家有所幫助。
1. 李宏毅 - 機器學習公開課
講師
李宏毅現(xiàn)任臺灣大學電氣工程助理教授,研究重點是機器學習,特別是深度學習領(lǐng)域。他的一系列機器學習課程公開課視頻,被很多人在機器學習領(lǐng)域當做入門教材。

李老師的課程中干貨滿滿,其課程視頻被許多人稱贊為最好的中文機器學習課程視頻。李老師的講課風格偏向于幽默風趣,經(jīng)常會使用一些卡通形象來增加課程的趣味性。一些晦澀難懂的理論知識,在他形象生動的講解下往往會變的容易掌握。
課程內(nèi)容
這門課程在內(nèi)容方面其實更加偏向于深度學習領(lǐng)域,相對來說比較進階,但李宏毅老師自信的表示,這并不會影響這門課“機器學習入門課”的屬性,仍然會讓絕大多數(shù)人聽得懂,大家仍然可以嘗試著將它作為機器學習的第一門課。
既然是入門課,那它的課程設置必然就相對比較容易上手,“從最基本的觀念講到最前瞻的技術(shù)”是這門課的一大特色,其2021年的課程是這樣設置的:
課程介紹
深度學習
自注意力
機器學習理論
Transformer
生成式模式
自監(jiān)督學習
可解釋AI / 對抗攻擊
域自適應 / 強化學習
量子機器學習
終身壓縮
元學習
亮點
李宏毅老師的課程總結(jié)下來有兩大亮點:
1. 結(jié)合卡通形象來講解理論知識,風格幽默風趣、生動形象
2. 適合初學者,有配套作業(yè)題
3. 使用Python作為編程語言,對大多數(shù)初學者比較友好
局限
這門課許多人譽為機器學習領(lǐng)域最好的中文入門課程,確實難以找出值得指點的不足之處。對有些完全沒有接觸過機器學習的同學來說,獨自完成其課后作業(yè)也許有些吃力,去網(wǎng)上找到一些配套答案或者編碼思路也是一件讓人頭疼的事。
課程難度
這是一門適合初學者的入門課程,重點偏向于深度學習,想對深度學習有所了解的同學可以嘗試去聽聽看。
基礎(chǔ)知識
這門課需要提前掌握數(shù)學和編程上的一些基礎(chǔ)知識。
數(shù)學上需要掌握:微積分、線性代數(shù)、概率論;
編程上需要掌握:Python相關(guān)語法、套件。在課程中需要能讀懂并修改課上給出的一些范例代碼,老師會默認你已經(jīng)基本掌握Python語法。
2. 貪心科技 - 人工智能與機器學習

講師
貪心科技是一家熱門的專注于AI教育的科技公司,核心團隊由海內(nèi)外AI專家組成,旗下目前已經(jīng)出品了好幾門出色的AI領(lǐng)域課程。這門課程是由貪心科技團隊的李文哲和Jerry Yuan講師合作進行講授,課程之外還專門配備了多名助教老師負責課后答疑以及作業(yè)批改工作。
李文哲
曾任金融科技獨角獸公司的首席科學家、美國亞馬遜的高級工程師,先后負責過聊天機器人、量化交易、自適應教育、金融知識圖譜等項目,并在AAAI、KDD、AISTATS等頂會上發(fā)表過15篇以上論文,并榮獲IAAI,IPDPS的最佳論文獎,多次出席行業(yè)峰會發(fā)表演講。分別在USC, TAMU,南開攻讀博士、碩士和本科。在荷蘭訪問期間,師從AI頂級學者Max Welling教授。

Jerry Yuan
擁有14年人工智能、推薦系統(tǒng)、自然語言處理、數(shù)字圖像和視頻處理項目經(jīng)驗,主導多款核心推薦系統(tǒng)的研發(fā),是人工智能、分布式系統(tǒng)、云計算方面的專家。曾師從中國科學院王守覺院士從事人臉識別研究、共同發(fā)表論文。在美國博士期間,主要研究NASA(美國航天局)支持的基于人工智能的空間天氣預測項目。先后在AI相關(guān)會議和雜志上發(fā)表過15篇以上的論文。

課程內(nèi)容
這門課程主要面向想系統(tǒng)性學習AI的在職人士(IT、運營、產(chǎn)品、財務等等)以及在校學生,通過這門課程的學習可以為后續(xù)的轉(zhuǎn)型做準備,或者用這些學到的技術(shù)來提升工作的效率。在課程當中,所有核心機器學習算法背后的技術(shù)細節(jié)以及推導都得到了全面的闡述。除了每章之后的作業(yè)之外,課程中間還單獨設置了幾個實訓章節(jié)(見下圖),因此相較于諸如吳恩達等老師側(cè)重于理論方面的教學模式,這門課程更加偏向于理論與實戰(zhàn)的結(jié)合。

每次實訓作業(yè)的時候,作為新手免不了會遇到很多解決不掉的難題,貪心科技的課程相較于公開課而言,課后配置的助教答疑以及作業(yè)批改環(huán)節(jié)是一個很大的亮點。

這門課程全套共有17個章節(jié),其中包括5個項目作業(yè)章節(jié),所有的實訓案例都來自醫(yī)療、生物、社會科學等十幾個不同領(lǐng)域,與現(xiàn)實生活十分貼切,比如第一個項目作業(yè)“廣告點擊率預測”,就是去設計一個算法來匹配平臺用戶與廣告,達到撮合廣告主與平臺之間雙方利益的目的。相較于網(wǎng)上可以找到的公開課而言,它的內(nèi)容覆蓋非常全面。從它的課程目錄中我們就可以看出:
人工智能基礎(chǔ)
線性回歸
邏輯回歸
模型泛化
【項目作業(yè)】-廣告點擊率預測
樸素貝葉斯
【項目作業(yè)】-情感分析項目
決策樹
隨機森林
提升樹
【項目作業(yè)】-信用卡欺詐預測
K-Means
主成分分析
【項目作業(yè)】-零售場景中的用戶分層
神經(jīng)網(wǎng)絡
支持向量機
【項目作業(yè)】-手勢語識別
按照他們給出的學習方案,當你完整學完全套課程之后,將差不多可以達到初級算法工程師的技術(shù)標準,可以深入理解每一個機器學習算法細節(jié)和全部推導過程,并且通過大量案例的實戰(zhàn),獲得今后獨立解決任何AI問題的能力。
亮點
這門課程由于是專門面向初學者的商業(yè)課程,所以相對來說它更加注重滿足用戶群的需求。先來看看貪心科技官網(wǎng)給出的這門課程的賣點:
當然,想要知道這門課程的好壞,肯定還是親自測評比較靠譜。在經(jīng)過本人親測之后,感覺這門課程有下面幾個讓我眼前一亮的閃光點:
1. 覆蓋面廣,基礎(chǔ)知識講解透徹,對初學者十分友好。
2. 實操作業(yè)多,且案例覆蓋領(lǐng)域較廣,可以及時對所學理論進行鞏固和應用。
3. 不需要自己下載軟件,所有練習都可在平臺在線完成。
4. 有助教隨時進行作業(yè)答疑。
其中,“有助教”這一點,對我來講應該是這門課程最大的一個優(yōu)勢。相較于網(wǎng)上冰冷的自學課程而言,與助教進行有效的互動可以隨時解決自己遇到的問題,省去了大把查閱資料的精力,學習起來十分省心。
局限
這門課程與免費的公開課相比,唯一的局限性可能就在于它是付費課程。但是這門課程堪比于手把手教學的講解精細程度,以及其作為商業(yè)課程所獨具的配套資源,會另人感嘆付費確實有付費的道理。對于沒有接觸過機器學習且手頭稍微寬裕的初學者來說,如果十分想要比較系統(tǒng)的了解機器學習的話,可以去了解一下這門課程。
課程難度
這門課適合想要轉(zhuǎn)型投身AI行業(yè)的初學者,需要的基礎(chǔ)知識不多,并且課程當中知識點講解比較透徹,作為小白十分容易上手,再加上有助教老師的答疑,學習起來可以算是毫不費力。學完全套課程之后可以達到初級算法工程師的標準,技術(shù)上完全可以勝任。
基礎(chǔ)知識
具備高中以上數(shù)學基礎(chǔ),了解簡單的統(tǒng)計與線性代數(shù);半年以上編程經(jīng)驗,包括但不限于Python。
3. 吳恩達-Machine Lerning |Coursera
講師
吳恩達(Andrew Ng),斯坦福大學教授,谷歌大腦、Coursera的創(chuàng)始人之一,百度首席科學家,研究重點是深度學習。

作為斯坦福大學教授,Ng講課風格偏向于嚴謹,可以把知識點往細節(jié)出深挖,課程里面用到的數(shù)學知識Ng一般都會進行耐心的講解,這對于數(shù)學不好的同學十分友好。
課程內(nèi)容
這門課程的重點是對概念的講解,理解算法,并理解選用特定算法的原因和意義,課程相對獨立。每個算法所需要的所有數(shù)學,在這門課中也得到了完整的解釋。其課程結(jié)構(gòu)如下:
單變量的線性回歸
回顧線性代數(shù)
多變量的線性回歸
Octave / Matlab教程
Logistic回歸
正則化
神經(jīng)網(wǎng)絡:表示
神經(jīng)網(wǎng)絡:學習
應用機器學習的建議
機器學習系統(tǒng)設計
支持向量機
降維
異常檢測
推薦系統(tǒng)
大規(guī)模機器學習
應用示例:Photo OCR
亮點
這門課程的亮點在于,對數(shù)學基礎(chǔ)不足的同學十分友好,有單獨的章節(jié)專門為同學們補習能夠用到的數(shù)學知識。
局限
這門課雖然也是入門課程,并且有其獨到的優(yōu)勢,但其局限性也是不可忽視的(個人感觀):
首先,這門課程使用的開源編程語言不是目前所流行Python,而是Octave。實際上Octave算是一種學習Machine Lerning基礎(chǔ)知識最簡單的一種方式,有精力的同學可以嘗試接觸著了解一下。但對大多數(shù)人來說,這確實是很不友好的一點。
其次,這門課是英文授課,對英語基礎(chǔ)不好的小白來講又是一個致命的打擊。當然網(wǎng)上也可以找到帶有中文字幕的版本,但建議還是通過原版視頻來學習這門課程的精髓。
課程難度
這門課適合數(shù)學基礎(chǔ)薄弱的初學者,但由于使用Octave語言,為大多數(shù)初學者增加了一分障礙。并且需要一定的英語基礎(chǔ)。
基礎(chǔ)知識
Octave基本語法(課程當中也會帶著一起了解)
英語基礎(chǔ)
4.Jeremy - 程序員機器學習入門
講師
Jeremy Howard,曾任Kaggle總裁和首席科學家,F(xiàn)ast.ai創(chuàng)始研究員。

相較于Ng的“數(shù)學優(yōu)先”教學模式,Jeremy更加追求“代碼優(yōu)先”的實用路線,因此他的課程風格一般以實操訓練為重點。
課程內(nèi)容
根據(jù)主頁介紹,這門課程主要囊括了兩種模型:基于決策樹的模型和基于梯度下降的模型。

由于這門課程以實操為側(cè)重點,對數(shù)學理論及一些概念并沒有做過多的闡述,因此其課程設置與其它課程比起來較為獨特。具體課程設置如下:
隨機森林簡介
深入了解隨機森林
性能、驗證和模型介紹
特征的重要性、數(shù)解釋器
推理與隨機森林
數(shù)據(jù)產(chǎn)品
cython與隨機森林
梯度下降和邏輯回歸
正則化、學習率和NLP
NLP與柱狀數(shù)據(jù)
嵌入
Rossmann問題與道德問題(用零售商Rossmann的數(shù)據(jù)集,構(gòu)建模型預測銷量)
亮點
這門課有三大亮點:
1. 課程輕量,總共十二節(jié)課,每節(jié)大約兩個小時,學快的同學用24小時就可以從無到有實現(xiàn)機器學習入門。
2. 用到的編程語言容易接受,是目前流行的Python語言。
3. 課程設置偏向于實操。
局限
既然Jeremy想走實操路線,那這門課程的局限性也就顯而易見。對基礎(chǔ)不好的同學來說,這門課有些難以上手,需要自行惡補用到的數(shù)學知識。再有就是這門課同樣是英文授課,英文不好的同學又需要依靠網(wǎng)上并不完美的翻譯版本來接觸這門課了(學習英語很重要呀!?。。?/p>
課程難度
課程雖然是為初學者準備的,但由于基礎(chǔ)數(shù)學概念方面闡述的不足,以及硬核的實操訓練,可能會讓一些同學學起來有些吃力,加上是英語授課,所以個人感覺這門課可以作為其他課程的補充課程,不太適合直接用來入門。
基礎(chǔ)知識
這門課需要童鞋們有一定的數(shù)學基礎(chǔ),特別是線性代數(shù)、微積分以及概率論;其次需要提前掌握基本的Python語法;最后就是還需要有一定的英語基礎(chǔ)。
總結(jié)
上面比較了四門網(wǎng)絡上比較熱門的課程,可以看出,每門課都有自己的優(yōu)點和不足。個人建議,作為小白可以先從免費的公開課下手,比如風格幽默風趣的李宏毅老師的公開課,通過其輕松的上課方式讓自己初步了解什么是機器學習;然后如果想要真正系統(tǒng)學習的話,還是建議選擇專業(yè)團隊旗下付費的商業(yè)課程,比如剛剛提到的比較熱門的貪心科技,這樣會使你的學習事半功倍。
當然,一千個讀者一千個哈姆雷特,上述課程只是一些比較熱門的選擇,只是作為參考。但一定要記住,無論選擇什么課程,堅持上完永遠是最重要的?。?!
最后,還是預祝同學們在AI世界里玩的開心呀:)
