CoreNLP自然語言分析工具集
CoreNLP 是斯坦福提供的一組用Java編寫的自然語言分析工具。它可以接受原始的人類語言文本輸入,并給出單詞的基本形式,其詞性,是否為公司,人員等的名稱,規(guī)范化和解釋日期,時(shí)間和數(shù)字量,標(biāo)記句子的結(jié)構(gòu)在短語或單詞從屬關(guān)系方面,并指出哪些名詞短語指代相同的實(shí)體。
它最初是為英語開發(fā)的,但現(xiàn)在也為(現(xiàn)代標(biāo)準(zhǔn))阿拉伯語,(大陸)中文,法語,德語和西班牙語提供不同級別的支持。斯坦福大學(xué)的CoreNLP是一個(gè)集成的框架,這使得將一堆語言分析工具應(yīng)用于一段文本變得非常容易。從純文本開始,您只需兩行代碼即可運(yùn)行所有工具。
它的分析為更高層次和特定領(lǐng)域的文本理解應(yīng)用程序提供了基礎(chǔ)構(gòu)建塊。Stanford CoreNLP是一套穩(wěn)定且經(jīng)過測試的自然語言處理工具,已被學(xué)術(shù)界,行業(yè)和政府中的各個(gè)團(tuán)體廣泛使用。這些工具使用基于規(guī)則的,概率機(jī)器學(xué)習(xí)和深度學(xué)習(xí)組件。
評論
圖片
表情
