這就是搜索引擎 : 核心技術詳解
搜索引擎作為互聯(lián)網(wǎng)發(fā)展中至關重要的一種應用,已經(jīng)成為互聯(lián)網(wǎng)各個領域的制高點,其重要性不言而喻。搜索引擎領域也是互聯(lián)網(wǎng)應用中不多見的以核心技術作為其命脈的領域,搜索引擎各個子系統(tǒng)是如何設計的?這成為廣大技術人員和搜索引擎優(yōu)化人員密切關注的內容。
本書的最大特點是內容新穎全面而又通俗易懂。對于實際搜索引擎所涉及的各種核心技術都有全面細致的介紹,除了作為搜索系統(tǒng)核心的網(wǎng)絡爬蟲、索引系統(tǒng)、排序系統(tǒng)、鏈接分析及用戶分析外,還包括網(wǎng)頁反作弊、緩存管理、網(wǎng)頁去重技術等實際搜索引擎必須關注的技術,同時用相當大的篇幅講解了云計算與云存儲的核心技術原理。另外,本書也密切關注搜索引擎發(fā)展的前沿技術:Google的咖啡因系統(tǒng)及Megastore等云計算新技術、百度的暗網(wǎng)抓取技術阿拉丁計劃、內容農(nóng)場作弊、機器學習排序等。諸多新技術在相關章節(jié)都有詳細講解,同時對于社會化搜索、實...
搜索引擎作為互聯(lián)網(wǎng)發(fā)展中至關重要的一種應用,已經(jīng)成為互聯(lián)網(wǎng)各個領域的制高點,其重要性不言而喻。搜索引擎領域也是互聯(lián)網(wǎng)應用中不多見的以核心技術作為其命脈的領域,搜索引擎各個子系統(tǒng)是如何設計的?這成為廣大技術人員和搜索引擎優(yōu)化人員密切關注的內容。
本書的最大特點是內容新穎全面而又通俗易懂。對于實際搜索引擎所涉及的各種核心技術都有全面細致的介紹,除了作為搜索系統(tǒng)核心的網(wǎng)絡爬蟲、索引系統(tǒng)、排序系統(tǒng)、鏈接分析及用戶分析外,還包括網(wǎng)頁反作弊、緩存管理、網(wǎng)頁去重技術等實際搜索引擎必須關注的技術,同時用相當大的篇幅講解了云計算與云存儲的核心技術原理。另外,本書也密切關注搜索引擎發(fā)展的前沿技術:Google的咖啡因系統(tǒng)及Megastore等云計算新技術、百度的暗網(wǎng)抓取技術阿拉丁計劃、內容農(nóng)場作弊、機器學習排序等。諸多新技術在相關章節(jié)都有詳細講解,同時對于社會化搜索、實時搜索及情境搜索等搜索引擎的未來發(fā)展方向做了技術展望。為了增進讀者的理解,全書大量引入形象的圖片來講解算法原理,相信讀者會發(fā)現(xiàn)原來搜索引擎的核心技術理解起來比原先想象的要簡單得多。
張俊林:本科畢業(yè)于天津大學管理學院,2004年于中科院軟件所直接獲得博士學位并留所從事科研工作,研究方向為搜索引擎與自然語言處理。2005年在CSDN博客發(fā)布系列博文“搜索引擎設計實用教程:以百度為例”,在網(wǎng)絡上獲得了廣泛轉載與良好口碑。2006年作為聯(lián)合創(chuàng)始人建立了智能信息聚合網(wǎng)站“玩聚網(wǎng)”,曾先后于阿里巴巴搜索技術中心任資深搜索技術研究員、房價網(wǎng)首席研究員,現(xiàn)任職于新浪微博,從事微博搜索與語義分析及推薦方面的研發(fā)工作。
