用Python编写爬虫入门容易吗?
- 内容介绍
- 文章标签
- 相关推荐
本文共计256个文字,预计阅读时间需要2分钟。
所谓网络爬虫,通俗的讲,就是通过向我们需要的信息的URL发起HTTP请求,获取该URL对应的HTTP报文主体内容,然后从中提取出我们所需要的信息。下面是一个简单的爬虫程序,它包含了HTTP基础知识。
所谓网络爬虫,通俗的讲,就是通过向我们需要的URL发出voice.hupu.com/nba' # 虎扑nba新闻 # 利用requests对象的get方法,对指定的url发起请求 # 该方法会返回一个Response对象 res = requests.get(url, headers=headers) # 通过Response对象的text方法获取网页的文本信息 print(res.text)
上面的代码中,我们向虎扑的服务器发送了一个get请求,获取虎扑首页的nba新闻。headers参数指的是www.baidu.com") #调用库中的方法,将请求回应封装到response对象中 html=response.read() #调用response对象的read()方法,将回应字符串赋给hhtml变量 print html #打印出来
实例二:
#第二中方法 import urllib2 req=urllib2.Request("ww.baidu.com") response=urllib2.urlopen(req) html = response.read() print html
到此这篇关于用python写爬虫简单吗的文章就介绍到这了,更多相关python写爬虫难吗内容请搜索易盾网络以前的文章或继续浏览下面的相关文章希望大家以后多多支持易盾网络!
本文共计256个文字,预计阅读时间需要2分钟。
所谓网络爬虫,通俗的讲,就是通过向我们需要的信息的URL发起HTTP请求,获取该URL对应的HTTP报文主体内容,然后从中提取出我们所需要的信息。下面是一个简单的爬虫程序,它包含了HTTP基础知识。
所谓网络爬虫,通俗的讲,就是通过向我们需要的URL发出voice.hupu.com/nba' # 虎扑nba新闻 # 利用requests对象的get方法,对指定的url发起请求 # 该方法会返回一个Response对象 res = requests.get(url, headers=headers) # 通过Response对象的text方法获取网页的文本信息 print(res.text)
上面的代码中,我们向虎扑的服务器发送了一个get请求,获取虎扑首页的nba新闻。headers参数指的是www.baidu.com") #调用库中的方法,将请求回应封装到response对象中 html=response.read() #调用response对象的read()方法,将回应字符串赋给hhtml变量 print html #打印出来
实例二:
#第二中方法 import urllib2 req=urllib2.Request("ww.baidu.com") response=urllib2.urlopen(req) html = response.read() print html
到此这篇关于用python写爬虫简单吗的文章就介绍到这了,更多相关python写爬虫难吗内容请搜索易盾网络以前的文章或继续浏览下面的相关文章希望大家以后多多支持易盾网络!

