爬虫python入门 python爬虫怎么写循环爬取多个页面？

2021-03-18

2072

python爬虫怎么写循环爬取多个页面？动态加载的数据是在用户通过鼠标或键盘执行某些操作后加载的。所以我们使用selenium提供的webdriver工具调用本地浏览器，让程序代替人类行为，滚动页面，

python爬虫怎么写循环爬取多个页面？

动态加载的数据是在用户通过鼠标或键盘执行某些操作后加载的。

所以我们使用selenium提供的webdriver工具调用本地浏览器，让程序代替人类行为，滚动页面，单击按钮，提交表单等等。从而得到所需的数据。所以我认为使用selenium方法抓取动态页面的中心思想是模拟人类行为。

在这里我想到两种：

1。要爬网的链接是规则的，例如按顺序增长的页码。你可以在for和1

2链接不规则的循环中读取页面，你可以抓取一个初始页面的链接，然后分析页面中所有符合条件的URL地址，并将地址保存在链表中。另一个程序不断地从链表中读取数据，分析页面，抓取新页面中的链接，并将其存储在链表中，从而不断地生成新的链接，可以不断地抓取