一、Java中文分詞元件word的擷取
-
Java中文分詞元件word,jar包擷取:
連結:https://pan.baidu.com/s/1PKtVNOVUmoSAb8qni8BTUw
提取碼:bi1h
-
Java中文分詞元件word的使用方法,可以參考楊老師的GitHub,上面有詳細的api調用
連結:https://github.com/ysc/word
二、NetBeans 8.2 配置Java中文分詞元件word 1.3
- 打開NetBeans 8.2
- 建立一個Maven項目(直接下一步,直至完成)
- 滑鼠右擊“依賴關系”,然後添加依賴關系
- 在查詢框中輸入關鍵字:word,在搜尋結果中找到:org.apdplat : word,點選旁邊的加号,再點選:1.3 jar之類的,最後将該jar包添加進去就大功告成了。(如果搜不到,就通過文章開頭提供的網盤連結,下載下傳word分詞包,直接粘貼進去,最後還要配置pom.xml檔案,文章末尾附如何修改該檔案)
三、簡單使用
- 在源包中建立一個類
- 添加以下代碼
package com.mycompany.mavenproject1;
import java.util.List;
import org.apdplat.word.WordSegmenter;
import org.apdplat.word.segmentation.Word;
public class NewClass {
public static void main(String[] args) throws Exception {
List<Word> words = WordSegmenter.seg("楊尚川是APDPlat應用級産品開發平台的作者楊尚川是APDPlat應用級産品開發平台的作者");
System.out.println(words);
}
}
- 運作效果:
- 附加:pom.xml檔案(如果是手動添加jar包的,在pom.xml檔案中添加如下代碼)