爬虫代理ip，报错 #7

90house · 2017-07-08T10:22:44Z

我对代码进行了改造，使用了代理ip但是仍然报错：

uk:2518160999 error to fetch files,try again later

getShareLists errno:-55

代码如下：
def getHtml(url,ref=None,reget=5):
try:
proxies={'http': '222.194.14.130:808'}
proxy_support = urllib2.ProxyHandler(proxies)
opener = urllib2.build_opener(proxy_support, urllib2.HTTPHandler)
#定义Opener
# urllib2.install_opener(opener)
request = urllib2.Request(url)
request.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.135 Safari/537.36')
if ref:
request.add_header('Referer',ref)
page = urllib2.urlopen(request,timeout=10)
html = page.read()
except:
if reget>=1:
#如果getHtml失败，则再次尝试5次
print 'getHtml error,reget...%d'%(6-reget)
time.sleep(2)
return getHtml(url,ref,reget-1)
else:
print 'request url:'+url
print 'failed to fetch html'
exit()
else:
return html

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

爬虫代理ip，报错 #7

爬虫代理ip，报错 #7

90house commented Jul 8, 2017

爬虫代理ip，报错 #7

爬虫代理ip，报错 #7

Comments

90house commented Jul 8, 2017