Web數(shù)據(jù)挖掘
《Web數(shù)據(jù)挖掘》旨在講述這些任務(wù)以及它們的核心挖掘算法;盡可能涵蓋每個話題的廣泛內(nèi)容,給出足夠多的細(xì)節(jié),以便讀者無須借助額外的閱讀,即可獲得相對完整的關(guān)于算法和技術(shù)的知識。其中結(jié)構(gòu)化數(shù)據(jù)的抽取、信息整合、觀點挖掘和Web使用挖掘等4章是《Web數(shù)據(jù)挖掘》的特色,這些內(nèi)容在已有書籍中沒有提及,但它們在Web數(shù)據(jù)挖掘中卻占有非常重要的地位。當(dāng)然,傳統(tǒng)的Web挖掘主題,如搜索、頁面爬取和資源探索以及鏈接分析在書中也作了詳細(xì)描述。
《Web數(shù)據(jù)挖掘》盡管題為“Web數(shù)據(jù)挖掘”,卻依然涵蓋了數(shù)據(jù)挖掘和信息檢索的核心主題;因為Web挖掘大量使用了它們的算法和技術(shù)。數(shù)據(jù)挖掘部分主要由關(guān)聯(lián)規(guī)則和序列模式、監(jiān)督學(xué)習(xí)(分類)、無監(jiān)督學(xué)習(xí)(聚類)這三大最重要的數(shù)據(jù)挖掘任務(wù),以及半監(jiān)督學(xué)習(xí)這個相對深入的主題組成。而信息檢索對于Web挖掘而言最重要的核心主題都有所闡述。
Bing Liu 劉兵,伊利諾伊大學(xué)芝加哥分校(UIC)教授,他在愛丁堡大學(xué)獲得人工智能博士學(xué)位。劉兵教授是Web挖掘研究領(lǐng)域的國際知名專家,在Web內(nèi)容挖掘、互聯(lián)網(wǎng)觀點挖掘、數(shù)據(jù)挖掘等領(lǐng)域有非常高的造詣,他先后在國際著名學(xué)術(shù)期刊與重要國際學(xué)術(shù)會議(如KDD、WWW、AAAI、SIGIR、ICML、TKDE等)上發(fā)布關(guān)于數(shù)據(jù)挖掘、Web挖掘和文本挖掘論文一百多篇。劉兵教授擔(dān)任過多個國際期刊的編輯,也是多個國際學(xué)術(shù)會議(如WWW、KDD與AAAI等)的程序委員會委員。更多的信息,可訪問他的個人主頁http://www.cs.uic.edu/~liub
