斯坦福词性标注,Stanford Log-linear Part-Of-Speech Tagger
http://nlp.stanford.edu/software/tagger.shtml ,下载地址http://nlp.stanford.edu/software/stanford-postagger-full-2016-10-31.zip
将下载的zip文件解压,进入到解压之后的根目录中,可以看到有sh文件,bat文件等等。通过阅读README.txt文件,可以知道如何使用命令行直接调用执行得到词性标注后的结果,这里介绍很详细,包括了Windows环境、Linux环境下的执行命令等等。models文件夹中存放的是各种训练好的模型,包括英文的,中文的,德语的等等。命令行下面的运行,跟Stanford Segmenter类似,这里只介绍如何在eclipse开发环境下使用词性标注。具体见下图
![](https://img.laitimes.com/img/__Qf2AjLwojIjJCLyojI0JCLiQ3chVEa0V3bT9CX5RXa2Fmcn9CXwczLcVmds92czlGZvwVP9EUTDZ0aRJkSwk0LcxGbpZ2LcBDM08CXlpXazRnbvZ2LcRlMMVDT2EWNvwFdu9mZvwVP0clW5VzValHZtJGasNjW1Z0VlZXUYpVd1kmYr50MZV3YyI2cKJDT29GRjBjUIF2LcRHelR3LcJzLctmch1mclRXY39DO5AjMzYzMxEzNyIDM3EDMy8CX0Vmbu4GZzNmLn9Gbi1yZtl2Lc9CX6MHc0RHaiojIsJye.jpg)
run as —-run configuration—-arguments,传入参数
models/chinese-distsim.tagger data/sample-input-utf8.txt
,运行之后的结果如上图所示。注意,使用的是分词之后的结果,再进行词性标注。