尝试下载nltk数据时出现405错误

当我尝试下面的代码

python -c "import nltk; nltk.download('punkt'); nltk.download('averaged_perceptron_tagger'); nltk.download('maxent_treebank_pos_tagger'); nltk.download('wordnet')" 

控制台说

 [nltk_data] Error loading punkt: HTTP Error 405: Not allowed. [nltk_data] Error loading averaged_perceptron_tagger: HTTP Error 405: [nltk_data] Not allowed. [nltk_data] Error loading maxent_treebank_pos_tagger: HTTP Error 405: [nltk_data] Not allowed. [nltk_data] Error loading wordnet: HTTP Error 405: Not allowed. 

这是由Github原始文件链接的衰落造成的。

同时,解决scheme是手动下载文件:

 PATH_TO_NLTK_DATA=/home/username/nltk_data/ wget https://github.com/nltk/nltk_data/archive/gh-pages.zip unzip gh-pages.zip mv nltk_data-gh-pages/ $PATH_TO_NLTK_DATA 

我们正在寻找数据和模型下载的替代scheme。

同时, @everyone请帮助检查您的脚本,并确保您不会超载数据下载! 先谢谢你!!

请查看https://github.com/nltk/nltk/issues/1787了解有关此问题的最新更新。;

对于MacOSX – 对上述答案的小修改:

 PATH_TO_NLTK_DATA=~/nltk_data/ wget https://github.com/nltk/nltk_data/archive/gh-pages.zip unzip gh-pages.zip mv nltk_data-gh-pages/packages/ $PATH_TO_NLTK_DATA 

请注意,这是一个大的下载(〜700MB)。