簡介
專門針對中文文檔的simhash算法庫簡介此項目用來對中文文檔計算出對應(yīng)的 simhash 值。 simhash 是谷歌用來進行文本去重的算法,現(xiàn)在廣泛應(yīng)用在文本處理中。詳見SimhashBlog特性 使用?CppJieba?作為分詞器和關(guān)鍵詞抽取器 使用?jenkins?作為 hash 函數(shù) hp... 更多
技術(shù)信息
開源協(xié)議
MIT
開發(fā)語言
C/C++
操作系統(tǒng)
Linux
軟件類型
開源軟件
所屬分類
神經(jīng)網(wǎng)絡(luò)/人工智能、 自然語言處理
開源組織
無
地區(qū)
國產(chǎn)
適用人群
未知
評價
0.0(滿分 10 分)0 個評分
什么是點評分
圖片
表情
全部評價(
0)
推薦率
100%

