我的機(jī)器學(xué)習(xí)入門清單及路線!
? 知乎:https://www.zhihu.com/people/huangzhe
這是我個(gè)人的機(jī)器學(xué)習(xí)入門清單及路線,所以沒有像很多收藏夾那樣大而全,一來學(xué)不完,二來給自己壓力。這是個(gè)人的路線。算是個(gè)人記錄,也給大家參考,如有什么不足之處,歡迎指教。
前置知識(shí)及技能:
1、線性代數(shù)基礎(chǔ),如果沒的話,還是先學(xué)了這門課在研究吧,不然會(huì)哭的。
2、學(xué)會(huì)python就行了。R也可以用用。
3、英語。起碼能基本的聽和讀吧,感覺中文的資料還不夠多,很難避免要看很多英文資料。建議學(xué)習(xí)某些教程時(shí)看英文版的tutorial,YouTube可以開字幕。
做了個(gè)流程圖,來展示下我的學(xué)習(xí)路線。

除了入門課程外,其他四項(xiàng)其實(shí)不完全是按照流程的(但總體上是),有時(shí)實(shí)戰(zhàn)時(shí)需要學(xué)新模型。有時(shí)學(xué)了某些模型再選方向也未遲。但是入門課程,尤其是Coursera那個(gè),一定要看完了才開始后面的學(xué)習(xí)。下面給出每項(xiàng)的學(xué)習(xí)地址:
入門課程
1.Machine Learning | Coursera 周志華機(jī)器學(xué)習(xí)
入門首選,推薦只認(rèn)識(shí)“機(jī)器學(xué)習(xí)”四個(gè)字但還不知道它是什么的學(xué)習(xí)。這些年機(jī)器學(xué)習(xí)的大多數(shù)年輕人靠這個(gè)入門。具體提綱我就不列了,免得增加篇幅。建議是直接按順序一課課學(xué),不要著急。在學(xué)完這個(gè)課程前,不要學(xué)后面的。
鏈接:https://www.coursera.org/learn/machine-learning
2.CS231n: Convolutional Neural Networks for Visual Recognition
Stanford最受歡迎的課之一。做圖像識(shí)別的,就算不想搞圖像識(shí)別,也會(huì)學(xué)到很多有用的通用的東西。
鏈接:http://cs231n.stanford.edu/
框架研究
TensorFlow。推薦一個(gè)簡單的中文入門教程。主講人是一個(gè)在美國讀大學(xué)的中國留學(xué)生,講得很有趣。國內(nèi)的朋友可以在bilibili看(一樣的)
B站鏈接:https://space.bilibili.com/16696495/#!/channel/detail?cid=1588
caffe
caffe是Facebook的開源框架。新的caffe2支持手機(jī)跑模型,可以說是非常先進(jìn)了(當(dāng)然手機(jī)性能嘛,就.....) 比較好的中文教程沒有找到,望有人留言推薦。
鏈接:http://caffe.berkeleyvision.org/tutorial/
theano
沒怎么研究這個(gè),但這個(gè)教程看起來不錯(cuò)
鏈接:https://www.youtube.com/watch?v=OU8I1oJ9HhI
技巧,算法與模型
特征工程:
特征工程到底是什么?https://www.zhihu.com/question/29316149/answer/110159647
CNN:
卷積神經(jīng)網(wǎng)絡(luò)工作原理直觀的解釋?https://www.zhihu.com/question/39022858)
RNN:
循環(huán)神經(jīng)網(wǎng)絡(luò)RNN打開手冊(cè) https://zhuanlan.zhihu.com/p/22930328
你有哪些deep learning(rnn、cnn)調(diào)參的經(jīng)驗(yàn)?https://www.zhihu.com/question/41631631
方向選擇
機(jī)器學(xué)習(xí)領(lǐng)域,如何選擇研究方向?https://www.zhihu.com/question/28689201
深度學(xué)習(xí)目前主要有哪些研究方向?https://www.zhihu.com/question/23140232
訓(xùn)練實(shí)戰(zhàn)
阿里云天池:
天池大數(shù)據(jù)眾智平臺(tái)-數(shù)據(jù)科學(xué)家社區(qū):https://tianchi.aliyun.com/?_lang=zh_CN
kaggle:一個(gè)競賽網(wǎng)站,被谷歌收購后更火爆了。
地址:https://www.kaggle.com/
很多比賽是有獎(jiǎng)金的,能拿個(gè)獎(jiǎng)基本大把公司主動(dòng)給你工作機(jī)會(huì)??梢詮腡itanic這個(gè)比賽開始。
Titanic: Machine Learning from Disaster:https://www.kaggle.com/c/titanic
要了解kaggle,我推薦一個(gè)不錯(cuò)的文章:https://zhuanlan.zhihu.com/p/25686876)
計(jì)算平臺(tái):
有的時(shí)候我們需要帶GPU的平臺(tái)跑代碼,本地性能可能不是很夠,推薦幾個(gè)(有免費(fèi)有收費(fèi)):
Kaggle. Kaggle可以用來當(dāng)羊毛薅,你可以傳自己的dataset上去,也可以用它提供的dataset。 Google Colab。等于一個(gè)免費(fèi)的notebook環(huán)境,而且還能用GPU。 百度AI Studio。就是不支持tensorflow
篇幅雖然有點(diǎn)短,但是學(xué)起來還是很久的,一起加油。
延伸閱讀:《Datawhale人工智能培養(yǎng)方案》
桔了個(gè)仔
南洋理工大學(xué)
Datawhale成員
整理不易,點(diǎn)贊三連↓

