如何用Python爬虫批量抓取网页中的长尾关键词图片并保存在本地?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1452个文字,预计阅读时间需要6分钟。
与爬取普通数据本质上相同,我们直接爬取数据并返回。对于图片,需要将其处理成二进制数据,保存为.jpg或.png等格式。以下是一个简化的示例:
直接爬取数据:[返回数据内容]图片处理:[图片二进制数据保存为.jpg或.png格式]
其实和爬取普通数据本质一样,不过我们直接爬取数据会直接返回,爬取图片需要处理成二进制数据保存成图片格式(.jpg,.png等)的数据文本。
现在贴一个url=img.ivsky.com/img/tupian/t/201008/05/bianxingjingang-001.jpg
请复制上面的url直接在某个浏览器打开,你会看到如下内容:
这就是通过网页访问到的该网站的该图片,于是我们可以直接利用requests模块,进行这个图片的请求,于是这个网站便会返回给我们该图片的数据,我们再把数据写入本地文件就行,比较简单。
本文共计1452个文字,预计阅读时间需要6分钟。
与爬取普通数据本质上相同,我们直接爬取数据并返回。对于图片,需要将其处理成二进制数据,保存为.jpg或.png等格式。以下是一个简化的示例:
直接爬取数据:[返回数据内容]图片处理:[图片二进制数据保存为.jpg或.png格式]
其实和爬取普通数据本质一样,不过我们直接爬取数据会直接返回,爬取图片需要处理成二进制数据保存成图片格式(.jpg,.png等)的数据文本。
现在贴一个url=img.ivsky.com/img/tupian/t/201008/05/bianxingjingang-001.jpg
请复制上面的url直接在某个浏览器打开,你会看到如下内容:
这就是通过网页访问到的该网站的该图片,于是我们可以直接利用requests模块,进行这个图片的请求,于是这个网站便会返回给我们该图片的数据,我们再把数据写入本地文件就行,比较简单。

