python爬虫简单的添加代理进行访问

优速盾-小U • 2025年6月23日 21:58 • 行业资讯 • 阅读 325

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

 1 import requests  2 from lxml import etree  3 url = "https://www.ip.cn"  4 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 OPR/57.0.3098.116", }  5 pro = {  6 # 'https': 'https://118.122.92.252:37901', #四川省成都市 电信  7 'https': 'https://27.17.45.90:43411', #湖北省武汉市 电信  8 }  9 try: 10 response = requests.get(url, headers=headers, proxies=pro) 11 html_str = response.content.decode() 12 # print(html_str) 13 html = etree.HTML(html_str) 14 message = html.xpath("//div[@class='well']//p/text()") 15 ip = html.xpath("//div[@class='well']//p/code/text()") 16 eng = html.xpath("//div[@class='well']/p/text()") 17 print(message[0]+ip[0]) 18 print(message[1]+ip[1]) 19 print(eng[2]) 20 except requests.exceptions.ProxyError as e: 21 print("当前代理异常") 22 except: 23 print("当前请求异常")

在上面的代码中,调用requests库,对一个IP地址查询网页进行访问,随后使用lxml库的xpath对网页进行分析提取,返回用户访问此网页时自己的IP地址,如果代理设置成功,则会返回你的信息和IP地址,如下:

代理成功则返回

如果代理失败则会返回异常,在代码中使用了捕获异常,则会返回设置的提示信息,”当前代理异常”,如果不是代理的错误则是”当前请求异常”

代理异常返回

PS:免费的代理不是很稳定,在确认代码无误后,如果仍然返回异常,可尝试更换代理IP…

原文链接：https://www.cnblogs.com/blackmanzhang/p/10489173.html

原创文章，作者：优速盾-小U，如若转载，请注明出处：https://www.cdnb.net/bbs/archives/33133

赞 (0)

0 0

制作和维护一个新网站的注意事项

上一篇 2025年6月23日 21:00

香港服务器如何配置ssl证书？具体的方法步骤

下一篇 2025年6月24日 05:40

行业资讯

买的香港云服务器怎么用？云服务器使用教程

香港云服务器的优势及好处，使得很多人都愿意使用和推荐，推荐的人多了自然购买的人就多了，其中不乏很大部分新手，购买之后却不知道…

优速盾-小U
2024年12月28日
000350
行业资讯

全新的AppleDNS 教你加速连接Apple云服务

全新的AppleDNS 教你加速连接Apple云服务我是企业级文章 2016年03月30日 00:13作者：小众软件编辑：王普 <!––> A…

优速盾-小U
2023年3月17日
000864
行业资讯

CDN的实现原理

由于用户访问源站业务有性能瓶颈，通过cdn技术把源站的内容缓存到多个节点。用户向源站域名发起请求时，请求会被调度至最接近用户的服务节点，直…

优速盾-小U
2022年8月5日
0001.7K
海外服务器TOP5，优缺点都在这里了

原标题：海外服务器TOP5，优缺点都在这里了在国内市场增速迅猛的当下，开放的国际市场环境，让越来越多的企业选择出海全球。得益于免备案的优势，成为众多用户企业的出海首要选择。云服…

优速盾-小U
行业资讯 2022年9月12日
000787
分享一下十种国内外优秀的免费CDN加速服务

这是一篇近些年来互联网上各种免费CDN服务的总结，也是近年来广为人知的国内外各种免费cdn服务，到目前为止，国内cdn业务已经不同于国外CDN业务。一般来说，CDN是为了加快网站访…

优速盾-小U
行业资讯 2022年10月4日
02014.5K
pyechartsV1.x版本使用Map绘制地图修改主题背景色等

# -*- coding: utf-8 -*- “”” @author: Dell Created on Mon Feb 3 11:22:25 2020 “”” from pyec…

优速盾-小U
行业资讯 2022年7月30日
000885
WhataretheTopAdvantagesandDisadvantagesofLinux?

Advantages of Linux Operating System Open-source software is a type of software that is de…

优速盾-小U
行业资讯 2025年5月2日
000315
香港显卡服务器与国内显卡服务器的区别？

无论是海外服务器还是国内服务器，它们的本质都是一样的，由于世界网络的散布情况不同，各个国家的网络环境不同。导致国家与国家之间的相互拜访经常…

优速盾-小U
行业资讯 2024年12月24日
000477
linuxsed命令

sed 是一个流编辑器(stream editor)，主要用来执行文本替换。但 sed 的主要设计目的是以批处理的方式而不是交互的方式来编辑文件。基本命令格式 sed [常用选项…

优速盾-小U
行业资讯 2025年7月10日
000293
Linux信号（signal)机制分析

【摘要】本文分析了Linux内核对于信号的实现机制和应用层的相关处理。首先介绍了软中断信号的本质及信号的两种不同分类方法尤其是不可靠信号的原理。接着分析了内核对于信号的处理流程包括…

优速盾-小U
行业资讯 2025年6月18日
000605

发表回复

优速盾注册领取大礼包www.cdnb.net

/sitemap.xml