网络爬虫-Python和数据分析.pdf
什么是网络爬虫?什么是网络爬虫?
网络爬虫是一个自动提取网页的程序,它为搜索
网络爬虫是一个自动提取网页的程序,它为搜索
引擎从万维网_上下载网页,是搜索引擎的重要组
引擎从万维网_上下载网页,是搜索引擎的重要组
成。传统爬虫从一个或若干初始网页的URL开始,
成.传统爬虫从一个或若干初始网页的url开始
获得初始网页上的URL,在抓取网页的过程中,
获得初始网页上的URL,在抓取网页的过程中,
不断从当前页面,上抽取新的URL放入队列,直到满
不断从当前页面,上抽取新的URL放入队列,直到满
足系统的一定停止条件
足系统的一定停止条件
网络爬虫-Python和数据分析.pdf
页:
[1]