当前位置:   article > 正文

NLP | NLTK_DATA下载的坑_nltk no such file or dictionary

nltk no such file or dictionary

一、github下载的NLTK_DATA报错

https://github.com/nltk/nltk_data/tree/gh-pages/packages

会有LookupError: Resource@##¥%¥%……#%*& not found.的错误

原因一:没解压

例如tokenizers里的punkt,直接git下来的是这样的

解压之后是这样的,对吧

原因二:路径不正确

然后当你想用比如这个包里的english.pickle

又报错如下

No such file or directory: nltk_data\\tokenizers\\punkt\\PY3\\english.pickle

说明这个包应该是放在一个PY3文件夹下,而不是直接在punkt文件夹下。

然后我人工加了一个PY3文件夹,终于不报错了,感觉有点麻烦。

二、总结

1、nltk.download()

这个方式下载的目录都是正确的,所以网速好的有V-P-N还是老老实实用这个下

  1. import nltk
  2. nltk.download()
  3. # 只安装popular
  4. nltk.download('popular')

当我没用V-P-N的时候,一打开nltk downloader就会蹦出来这个,页面也是空白的

[WinError 10054] 远程主机强迫关闭了一个现有连接

2、out of data

挂上V-P-N中终于不报错,但是在下载全部的popular(用得比较热门、流行的包)还是出现了out of data的的现象

于是,我去这个网站开始手动下载那些out of data的包...

https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml

比如还是刚才的punkt,直接去这个对应链接下载,注意!下载之后放在对应的目录下,你看url显示它的的上一层是tokenuzers

,就放在tokenuzers,放完一定要解压!

3、popular下载好的所有包

终于经过不懈努力,把所有的popular下好了,分享给大家!

链接:https://pan.baidu.com/s/1ZlX5cOAhstdoGV0Hb0Xxkw 
提取码:8p8x 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/344286
推荐阅读
相关标签
  

闽ICP备14008679号