簡介
HtmlExtractor是一個Java實現(xiàn)的基于模板的網(wǎng)頁結構化信息精準抽取組件,本身并不包含爬蟲功能,但可被爬蟲或其他程序調(diào)用以便更精準地對網(wǎng)頁結構化信息進行抽取。HtmlExtractor是為大規(guī)模分布式環(huán)境設計的,采用主從架構,主節(jié)點負責維護抽取規(guī)則,從節(jié)點向主節(jié)點請求抽取規(guī)則,當抽取規(guī)則發(fā)... 更多
技術信息
開源協(xié)議
GPLv3
開發(fā)語言
Java
操作系統(tǒng)
跨平臺
軟件類型
開源軟件
所屬分類
Web應用開發(fā)、 網(wǎng)頁組件
開源組織
無
地區(qū)
國產(chǎn)
適用人群
未知
評價
0.0(滿分 10 分)0 個評分
什么是點評分
圖片
表情
全部評價(
0)
推薦率
100%

