赞
踩
https://github.com/nltk/nltk_data/tree/gh-pages/packages
会有LookupError: Resource@##¥%¥%……#%*& not found.的错误
例如tokenizers里的punkt,直接git下来的是这样的
解压之后是这样的,对吧
然后当你想用比如这个包里的english.pickle
又报错如下
No such file or directory: nltk_data\\tokenizers\\punkt\\PY3\\english.pickle
说明这个包应该是放在一个PY3文件夹下,而不是直接在punkt文件夹下。
然后我人工加了一个PY3文件夹,终于不报错了,感觉有点麻烦。
这个方式下载的目录都是正确的,所以网速好的有V-P-N还是老老实实用这个下
- import nltk
- nltk.download()
- # 只安装popular
- nltk.download('popular')
当我没用V-P-N的时候,一打开nltk downloader就会蹦出来这个,页面也是空白的
[WinError 10054] 远程主机强迫关闭了一个现有连接
挂上V-P-N中终于不报错,但是在下载全部的popular(用得比较热门、流行的包)还是出现了out of data的的现象
于是,我去这个网站开始手动下载那些out of data的包...
https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml
比如还是刚才的punkt,直接去这个对应链接下载,注意!下载之后放在对应的目录下,你看url显示它的的上一层是tokenuzers
,就放在tokenuzers,放完一定要解压!
终于经过不懈努力,把所有的popular下好了,分享给大家!
链接:https://pan.baidu.com/s/1ZlX5cOAhstdoGV0Hb0Xxkw
提取码:8p8x
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。