Stanford CoreNLPJava 編寫的自然語言分析工具
Stanford CoreNLP 提供了一套用 Java 編寫的自然語言分析工具。它最初是為英語開發(fā)的,但現(xiàn)在也為(現(xiàn)代標(biāo)準(zhǔn))阿拉伯語、中文、法語、德語和西班牙語提供不同程度的支持。Stanford CoreNLP 是一個(gè)集成的框架,可以很容易地將一堆語言分析工具應(yīng)用于一段文本。它的分析為更高層次和特定領(lǐng)域的文本理解應(yīng)用提供了基礎(chǔ)性的構(gòu)建塊。Stanford CoreNLP 是一套穩(wěn)定的、經(jīng)過良好測試的自然語言處理工具,被學(xué)術(shù)界、工業(yè)界和政府的各種團(tuán)體廣泛使用。
使用 Ant 構(gòu)建
- 確保你已經(jīng)安裝了 Ant
- 使用以下命令編譯代碼:
cd CoreNLP ; ant - 然后運(yùn)行此命令以使用最新版本的代碼構(gòu)建一個(gè) jar:
cd CoreNLP/classes ; jar -cf ../stanford-corenlp.jar edu - 這將在包含最新代碼的 CoreNLP 文件夾中創(chuàng)建一個(gè)名為 stanford-corenlp.jar 的新 jar
- 與最新代碼一起使用的依賴項(xiàng)位于 CoreNLP/lib 和 CoreNLP/liblocal 中,因此請確保將它們包含在您的 CLASSPATH 中。
- 使用最新版本的代碼時(shí),請確保下載最新版本的 corenlp-models 、 english-models 和 english-models-kbp 并將它們包含在你的 CLASSPATH 中。
使用 Maven 構(gòu)建
- 確保你已經(jīng)安裝了 Maven
- 如果您在 CoreNLP 目錄中運(yùn)行此命令:
mvn package,它應(yīng)該運(yùn)行測試并構(gòu)建這個(gè) jar 文件:CoreNLP/target/stanford-corenlp-4.4.0.jar - 使用最新版本的代碼時(shí),請確保下載最新版本的 corenlp-models 、 english-extra-models 和 english-kbp-models 并將它們包含在您的 CLASSPATH 中。
- 如果您想將 Stanford CoreNLP 用作 Maven 項(xiàng)目的一部分,您需要將模型 jar 安裝到您的 Maven 倉庫中。下面是安裝西班牙模型 jar 的示例命令。 對于其他語言,只需更改命令中的語言名稱。 安裝
stanford-corenlp-models-current.jar你需要設(shè)置-Dclassifier=models. 這是西班牙語的示例命令:mvn install:install-file -Dfile=/location/of/stanford-spanish-corenlp-models-current.jar -DgroupId=edu.stanford.nlp -DartifactId=stanford-corenlp -Dversion=4.4.0 -Dclassifier=models-spanish -Dpackaging=jar
評論
圖片
表情
