天天看点

Stanford Tagger 词性标注

斯坦福词性标注,Stanford Log-linear Part-Of-Speech Tagger

http://nlp.stanford.edu/software/tagger.shtml ,下载地址http://nlp.stanford.edu/software/stanford-postagger-full-2016-10-31.zip

将下载的zip文件解压,进入到解压之后的根目录中,可以看到有sh文件,bat文件等等。通过阅读README.txt文件,可以知道如何使用命令行直接调用执行得到词性标注后的结果,这里介绍很详细,包括了Windows环境、Linux环境下的执行命令等等。models文件夹中存放的是各种训练好的模型,包括英文的,中文的,德语的等等。命令行下面的运行,跟Stanford Segmenter类似,这里只介绍如何在eclipse开发环境下使用词性标注。具体见下图

Stanford Tagger 词性标注

run as —-run configuration—-arguments,传入参数

models/chinese-distsim.tagger data/sample-input-utf8.txt

,运行之后的结果如上图所示。注意,使用的是分词之后的结果,再进行词性标注。

继续阅读