如何解决使用requests库爬取返回空数据的问题?

2026-04-20 11:481阅读0评论SEO基础
  • 内容介绍
  • 相关推荐

本文共计611个文字,预计阅读时间需要3分钟。

如何解决使用requests库爬取返回空数据的问题?

首先介绍一下,我用360搜索引擎选取了城市排名前20的城市。爬取的网址为:https://baike.so.com/doc/24368318-25185095.。需要爬取的内容包括:HTML标签、robots协议。目前我们开始使用Python IDLE进行爬取,导入必要的库。

首先介紹一下我們用360搜索派取城市排名前20。
我们爬取的网址:baike.so.com/doc/24368318-25185095.html

我们要爬取的内容:


html字段:


robots协议:


现在我们开始用python IDLE 爬取

import requests r = requests.get("baike.so.com/doc/24368318-25185095.html") r.status_code r.text

结果分析,我们可以成功访问到该网页,但是得不到网页的结果。被360搜索识别,我们将headers修改。

阅读全文

本文共计611个文字,预计阅读时间需要3分钟。

如何解决使用requests库爬取返回空数据的问题?

首先介绍一下,我用360搜索引擎选取了城市排名前20的城市。爬取的网址为:https://baike.so.com/doc/24368318-25185095.。需要爬取的内容包括:HTML标签、robots协议。目前我们开始使用Python IDLE进行爬取,导入必要的库。

首先介紹一下我們用360搜索派取城市排名前20。
我们爬取的网址:baike.so.com/doc/24368318-25185095.html

我们要爬取的内容:


html字段:


robots协议:


现在我们开始用python IDLE 爬取

import requests r = requests.get("baike.so.com/doc/24368318-25185095.html") r.status_code r.text

结果分析,我们可以成功访问到该网页,但是得不到网页的结果。被360搜索识别,我们将headers修改。

阅读全文