尝试下载nltk数据时出现405错误
当我尝试下面的代码
python -c "import nltk; nltk.download('punkt'); nltk.download('averaged_perceptron_tagger'); nltk.download('maxent_treebank_pos_tagger'); nltk.download('wordnet')"
控制台说
[nltk_data] Error loading punkt: HTTP Error 405: Not allowed. [nltk_data] Error loading averaged_perceptron_tagger: HTTP Error 405: [nltk_data] Not allowed. [nltk_data] Error loading maxent_treebank_pos_tagger: HTTP Error 405: [nltk_data] Not allowed. [nltk_data] Error loading wordnet: HTTP Error 405: Not allowed.
这是由Github原始文件链接的衰落造成的。
同时,解决scheme是手动下载文件:
PATH_TO_NLTK_DATA=/home/username/nltk_data/ wget https://github.com/nltk/nltk_data/archive/gh-pages.zip unzip gh-pages.zip mv nltk_data-gh-pages/ $PATH_TO_NLTK_DATA
我们正在寻找数据和模型下载的替代scheme。
同时, @everyone请帮助检查您的脚本,并确保您不会超载数据下载! 先谢谢你!!
对于MacOSX – 对上述答案的小修改:
PATH_TO_NLTK_DATA=~/nltk_data/ wget https://github.com/nltk/nltk_data/archive/gh-pages.zip unzip gh-pages.zip mv nltk_data-gh-pages/packages/ $PATH_TO_NLTK_DATA
请注意,这是一个大的下载(〜700MB)。