0粉絲
本書是獵兔搜索開發(fā)團(tuán)隊(duì)的軟件研發(fā)和教學(xué)實(shí)踐的經(jīng)驗(yàn)匯總。 本書總結(jié)搜索引擎相關(guān)理論與實(shí)際解決方案,并給出了Java實(shí)現(xiàn),其中利用了流行的開源項(xiàng)目Lucene和Solr,而且還包括原創(chuàng)的實(shí)現(xiàn)。 主要包括總體介紹部分、爬蟲部分、自然語(yǔ)言處理部分、全文檢索部分以及相關(guān)案例分析。 爬蟲部分介紹了網(wǎng)頁(yè)遍歷方法和如何實(shí)現(xiàn)增量抓取。并介紹了從網(wǎng)頁(yè)等各種格式的文檔中提取主要內(nèi)容的方法。 自然
簡(jiǎn)介
本書是獵兔搜索開發(fā)團(tuán)隊(duì)的軟件研發(fā)和教學(xué)實(shí)踐的經(jīng)驗(yàn)匯總。 本書總結(jié)搜索引擎相關(guān)理論與實(shí)際解決方案,并給出了Java實(shí)現(xiàn),其中利用了流行的開源項(xiàng)目Lucene和Solr,而且還包括原創(chuàng)的實(shí)現(xiàn)。 主要包括總體介紹部分、爬蟲部分、自然語(yǔ)言處理部分、全文檢索部分以及相關(guān)案例分析。 爬蟲部分介紹了網(wǎng)頁(yè)遍歷方法和如何實(shí)現(xiàn)增量抓取。并介紹了從網(wǎng)頁(yè)等各種格式的文檔中提取主要內(nèi)容的方法。 自然... 更多
屬性
出版社
電子工業(yè)出版社
出品方
博文視點(diǎn)
ISBN
9787621096407
出版年
2011-5-13
裝幀
平裝
價(jià)格
55.00
頁(yè)數(shù)
600
評(píng)價(jià)
0.0(滿分 10 分)0 個(gè)評(píng)分
什么是點(diǎn)評(píng)分
圖片
表情
全部評(píng)價(jià)(
0)
推薦率
100%

