在python中使用庖丁分词,因为庖丁分词使用java写的。所以又通过jpype来调用庖丁分词jar包。
python版本:3.6.3 JDK版本 8.0 jpype版本 0.6.2
编辑代码:
import jpype
#引用庖丁分词jar包
classPath = '/Users/lionelmac/PycharmProjects/TxtPrep'
print(classPath)
jvm_path = jpype.getDefaultJVMPath()
jvm_arg = "-Djava.class.path=" + classPath
print(jvm_arg)
if not jpype.isJVMStarted():
jpype.startJVM(jvm_path,'-ea', jvm_arg)
PaodingAnalyzer = jpype.JClass('paoding-analysis.net.paoding.analysis.analyzer.PaodingAnalyzer')
analyze = PaodingAnalyzer()
print(analyze)
点击运行,提示: java.lang.RuntimeException: Class paoding-analysis.net.paoding.analysis.analyzer.PaodingAnalyzer not found
无论怎么尝试 都是解决不了问题。于是不打算使用庖丁分词了,改用python环境下的分词技术 “结巴中文分词”