AVMOO_SPIDER

AVMOO, 番号， scrapy， python, 代理

如何白嫖代理？

ProxyService模块可以在线、动态的检测添加可用代理

ProxySource类本质上是爬虫，爬取主流代理网站的免费代理

ProxyValidator类动态检测来自ProxySource的代理，将通过验证的代理传递给ProxyHolder

ProxyHolder类保存所有通过验证的代理,调用get_one方法获取一个距离上次使用经过delay秒的可用代理(可能返回None)

Proxy类接受请求信息的反馈，调用good_proxy表示进行了一次成功的请求调用bad_proxy表示进行了一次失败的请求，Proxy类会定期检测失败率，剔除质量差的代理

如何使用 ?

proxy_holder = ProxyHolder()
proxy = proxy_holder.get_one()

res = requests.get(’https://www.baidu.com‘, proxies=proxy.to_dict())

if res.status != 200:
proxy.bad_proxy()
else:
proxy.good_proxy()

tips

Proxy.to_string() 生成用于scrapy Request的proxy字符串
Proxy.to_dict() 生成用于requests proxies 的字典

ProxyHolder的初始化会初始化所有的ProxySource爬取免费代理再进行一次完整的检测，所以会消耗3-5min的时间

如果要单独使用ProxyService，需要更改 import 的路径

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
.idea		.idea
AVMOO		AVMOO
Idea		Idea
README.md		README.md
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AVMOO_SPIDER

如何白嫖代理？

ProxyService模块可以在线、动态的检测添加可用代理

如何使用 ?

tips

About

Releases 4

Packages

Languages

justagoodman/AVMOO_SPIDER

Folders and files

Latest commit

History

Repository files navigation

AVMOO_SPIDER

如何白嫖代理？

ProxyService模块可以在线、动态的检测添加可用代理

如何使用 ?

tips

About

Topics

Resources

Stars

Watchers

Forks

Releases 4

Packages 0

Languages

Packages