用Python實現(xiàn)深度學(xué)習(xí)框架
本書帶領(lǐng)讀者用原生Python語言和Numpy線性代數(shù)庫實現(xiàn)一個基于計算圖的深度學(xué)習(xí)框架MatrixSlow(類似簡易版的PyTorch、TensorFlow或Caffe)。全書分為三個部分。第一部分是原理篇,實現(xiàn)了MatrixSlow框架的核心基礎(chǔ)設(shè)施,并基于此講解了機器學(xué)習(xí)與深度學(xué)習(xí)的概念和原理,比如模型、計算圖、訓(xùn)練、梯度下降法及其各種變體。第二部分是模型篇,介紹了多種具有代表性的模型,包括邏輯回歸、多層全連接神經(jīng)網(wǎng)絡(luò)、因子分解機、Wide & Deep、DeepFM、循環(huán)神經(jīng)網(wǎng)絡(luò)以及卷積神經(jīng)網(wǎng)絡(luò),這部分除了著重介紹這些模型的原理、結(jié)構(gòu)以及它們之間的聯(lián)系外,還用MatrixSlow框架搭建并訓(xùn)練它們以解決實際問題。第三部分是工程篇,討論了一些與深度學(xué)習(xí)框架相關(guān)的工程問題,內(nèi)容涉及訓(xùn)練與評估,模型的保存、導(dǎo)入和服務(wù)部署,分布式訓(xùn)練,等等。
張覺非
本科畢業(yè)于復(fù)旦大學(xué)計算機系,于中國科學(xué)院古脊椎動物與古人類研究所取得古生物學(xué)碩士學(xué)位,目前在互聯(lián)網(wǎng)行業(yè)從事機器學(xué)習(xí)算法相關(guān)工作。
陳震
碩士畢業(yè)于北京大學(xué)。現(xiàn)任奇虎360智能工程部總監(jiān)、負(fù)責(zé)人,帶領(lǐng)團隊建設(shè)集團的機器學(xué)習(xí)計算調(diào)度平臺、機器學(xué)習(xí)建模平臺、機器學(xué)習(xí)推理引擎以及推薦平臺等AI基礎(chǔ)設(shè)施。
