大數(shù)據(jù)
本書由斯坦福大學(xué)“Web 挖掘”課程的內(nèi)容總結(jié)而成,主要關(guān)注極大規(guī)模數(shù)據(jù)的挖掘。主要內(nèi)容包括分布式文件系統(tǒng)、相似性搜索、搜索引擎技術(shù)、頻繁項集挖掘、聚類算法、廣告管理及推薦系統(tǒng)、社會網(wǎng)絡(luò)圖挖掘和大規(guī)模機器學(xué)習(xí)等。其中每一章節(jié)有對應(yīng)的習(xí)題,以鞏固所講解的內(nèi)容。讀者更可以從網(wǎng)上獲取相關(guān)拓展材料。
Jure Leskovec
斯坦福大學(xué)計算機科學(xué)系助理教授,研究方向是大型社交和信息網(wǎng)絡(luò)的數(shù)據(jù)挖掘。他的研究成果獲得了很多獎項,如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship,還獲得了很多最佳論文獎,同時也被《紐約時報》《華爾街日報》《華盛頓郵報》《麻省理工科技評論》《連線》、NBC、BBC等流行的社會媒體刊載。他還創(chuàng)建了斯坦福網(wǎng)絡(luò)分析平臺(SNAP,http://snap.stanford.edu)。Twitter賬號是@jure。
Anand Rajaraman
數(shù)據(jù)庫和Web技術(shù)領(lǐng)域權(quán)威,創(chuàng)業(yè)投資基金Cambrian聯(lián)合創(chuàng)始人,斯坦福大學(xué)計算機科學(xué)系助理教授。Rajaraman的職業(yè)生涯非常成功:1996年...
Jure Leskovec
斯坦福大學(xué)計算機科學(xué)系助理教授,研究方向是大型社交和信息網(wǎng)絡(luò)的數(shù)據(jù)挖掘。他的研究成果獲得了很多獎項,如Microsoft Research Faculty Fellowship、Alfred P. Sloan Fellowship和Okawa Foundation Fellowship,還獲得了很多最佳論文獎,同時也被《紐約時報》《華爾街日報》《華盛頓郵報》《麻省理工科技評論》《連線》、NBC、BBC等流行的社會媒體刊載。他還創(chuàng)建了斯坦福網(wǎng)絡(luò)分析平臺(SNAP,http://snap.stanford.edu)。Twitter賬號是@jure。
Anand Rajaraman
數(shù)據(jù)庫和Web技術(shù)領(lǐng)域權(quán)威,創(chuàng)業(yè)投資基金Cambrian聯(lián)合創(chuàng)始人,斯坦福大學(xué)計算機科學(xué)系助理教授。Rajaraman的職業(yè)生涯非常成功:1996年創(chuàng)辦Junglee公司,兩年后被亞馬遜以2.5億美元收購,Rajaraman被聘為亞馬遜技術(shù)總監(jiān),推動亞馬遜從一個零售商轉(zhuǎn)型為零售平臺;2000年與人合創(chuàng)Cambrian,孵化出幾個后來被谷歌收購的公司;2005年創(chuàng)辦Kosmix公司并任CEO,該公司于2011年被沃爾瑪集團收購,Rajaraman被聘為沃爾瑪負(fù)責(zé)全球電子商務(wù)業(yè)務(wù)的高級副總裁。Rajaraman生于印度,在斯坦福大學(xué)獲得計算機科學(xué)碩士和博士學(xué)位。求學(xué)期間與人合著的一篇論文榮列近20年來被引用次數(shù)最多的論文之一。Twitter賬號是@anand_raj。
Jeffrey David Ullman
美國國家工程院院士,計算機科學(xué)家。早年在貝爾實驗室工作,之后任教于普林斯頓大學(xué),十年后加入斯坦福大學(xué)直至退休,一生的科研、著書和育人成果卓著。他是ACM會員,曾獲SIGMOD創(chuàng)新獎、高德納獎、馮諾依曼獎等多項科研大獎;他是“龍書”《編譯原理》、數(shù)據(jù)庫名著《數(shù)據(jù)庫系統(tǒng)實現(xiàn)》等多部經(jīng)典著作的合著者;麾下多名學(xué)生成為了數(shù)據(jù)庫領(lǐng)域的專家,其中最有名的當(dāng)屬谷歌創(chuàng)始人Sergey Brin;本書第二作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
