Common_Spider

一个还算通用的爬虫脚本，可自己设定爬取的深度，可以把网站的动态链接地址和外链单独分出来，做安全测试时可以提前爬一下页面，避免测试时会有遗漏。

Change Log

使用比较简单：

安装requests依赖

pip install requests

运行爬虫

 python2 spider_v3.py  url  5   --> url为待爬取的网站地址，5为爬取深度，可以不设，默认为5。

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
README.md		README.md
pic0.png		pic0.png
pic1.png		pic1.png
pic2.png		pic2.png
spider_v3.py		spider_v3.py
www.wuhubtv.com.txt		www.wuhubtv.com.txt