如何用Python实现爬取百度及网站图片实例的代码？

2026-05-24 16:050阅读0评论SEO教程

本文共计1323个文字，预计阅读时间需要6分钟。

爬虫基本流程+发起请求：通过HTTP库向目标站点发起请求，发送一个Request，请求可以包含额外的header等信息。等待服务器响应+获取响应内容：如果服务器能正常响应，会得到一个响应内容。

爬虫基本流程

发起请求：通过HTTP库向目标站点发起请求，也就是发送一个Request，请求可以包含额外的header等信息，等待服务器响应

获取响应内容：如果服务器能正常响应，会得到一个Response，Response的内容便是所要获取的页面内容，类型可能是HTML,Json字符串，二进制数据（图片或者视频）等类型

解析内容：得到的内容可能是HTML,可以用正则表达式，页面解析库进行解析，可能是Json,可以直接转换为Json对象解析，可能是二进制数据，可以做保存或者进一步的处理

保存数据：保存形式多样，可以存为文本，也可以保存到数据库，或者保存特定格式的文件

在这里有一个小技巧，百度图片展示是下拉式的，要想看更多的图片，需要滑动滚轮让界面加载才可以查看。

普通的爬虫对于百度图片的url只会接受到未滚动滚轮前界面所展示的所有信息

因此这里有一个小技巧，如上图红框中的信息index，在这里用字符flip替换掉index,即可实现图片分页，但其实分页图片都是存在在一个界面的，也就意味着爬虫时不需要对分页做处理。

本文共计1323个文字，预计阅读时间需要6分钟。

发起请求：通过HTTP库向目标站点发起请求，也就是发送一个Request，请求可以包含额外的header等信息，等待服务器响应

保存数据：保存形式多样，可以存为文本，也可以保存到数据库，或者保存特定格式的文件

在这里有一个小技巧，百度图片展示是下拉式的，要想看更多的图片，需要滑动滚轮让界面加载才可以查看。

普通的爬虫对于百度图片的url只会接受到未滚动滚轮前界面所展示的所有信息