Stanford CoreNLP的源代码是使用Java写的,提供了Server方式进行交互。stanfordcorenlp是一个对Stanford CoreNLP进行了封装的Python工具包,GitHub地址,使用非常方便。
安装stanfordcorenlp包之前:
1:下载安装JDK 1.8及以上版本。
2:下载Stanford CoreNLP文件,解压。
3:处理中文还需要下载中文的模型[jar文件],然后放到stanford-corenlp-full根目录下即可(注意一定要下载这个文件哦,否则它默认是按英文来处理的)。
然后就是正常的流程
pip install stanford-corenlp
网上找了很多都是有点麻烦的配置,自己误打误撞弄出一个简单的分享一下,有问题可以留言讨论,
直接上代码:
import corenlp client = corenlp.CoreNLPClient(annotators='tokenize ssplit pos'.split()) str = 'proved to be fake, made-up' ann = client.annotate(str) sentence = ann.sentence[0] for token in sentence.token: print (token.word, token.pos)
接下来就会报错了,点进报错文档,锁定报错地点
文档时:client.py
地点:124行
然后开始改代码
124行:我直接注释掉了
125行:将原来的{CORENLP_HOME}替换成你下载的Stanford CoreNLP文件,解压后的文件目录路径。
126行:将原来的os.getenv("CORENLP_HOME")替换成你下载的Stanford CoreNLP文件,解压后的文件目录下的stanford-corenlp-3.9.1.jar路径
然后再次运行前的代码,成功完成:
proved VBN
to TO
be VB
fake JJ
, ,
made-up JJ
希望可以帮助到你。
版权声明:本文为博主原创文章,未经博主允许不得转载。