当前位置:   article > 正文

python使用urlretrieve下载文件时出现403 forbidden的解决方法(反爬虫)_urllib.request.urlretrieve 403: forbidden

urllib.request.urlretrieve 403: forbidden

python使用urlretrieve下载文件时出现403 forbidden的解决方法

出现该错误的原因是服务器开启了反爬虫,一般情况下只需要设置header模拟浏览器即可,但是urlretrieve并未提供header参数。

使用urlopen也可以直接下载文件,例

headers = {“User-Agent”: “Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.86 Safari/537.36”}
def down_pic(url, path):
try:
req = request.Request(url, headers=headers)
data = request.urlopen(req).read()
with open(path, ‘wb’) as f:
f.write(data)
f.close()
except Exception as e:
print(str(e))
还有一种解决方法:

opener=urllib.request.build_opener()
opener.addheaders=[(‘User-Agent’,‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1941.0 Safari/537.36’)]
urllib.request.install_opener(opener)
urllib.request.urlretrieve(url, Path)

转载:https://www.213.name/archives/1087

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/247910
推荐阅读
相关标签
  

闽ICP备14008679号