很抱歉,您没有提供需要改写的句子。请提供您希望改写的句子,我将为您改写为一个长尾词的。

2026-06-09 11:241阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计666个文字,预计阅读时间需要3分钟。

很抱歉,您没有提供需要改写的句子。请提供您希望改写的句子,我将为您改写为一个长尾词的。

大 家 好,我 是 小 皮。一、前言。前 几 天 在 Python 白 银 群 里 有 个 叫 手 中 的 沙 漫 的 群 员 问 了 个 有 关 pyquery 选 择 器 的 问 题,现 在 就 是 这 个 问 题。原 网页 的 信 息 如 下 所 示:

很抱歉,您没有提供需要改写的句子。请提供您希望改写的句子,我将为您改写为一个长尾词的。

大家好,我是皮皮。

一、前言

前几天在Python白银群有个叫的粉丝问了一道关于​​pyquery​​选择器提取的问题,如下图所示。

就像这样:

原网页的信息如下图所示:

实现过程

这里给了一份代码,如下所示:

from pyquery import PyQuery as pq


headers = {
'Accept-Language': 'zh-CN,zh;q=0.9',
'Cache-Control': 'max-age=0',
'Upgrade-Insecure-Requests': '1',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}
html = pq(url='www.cditv.cn/list-3894-1.html', headers=headers)
doc = pq(html)
li = doc('div.style-type3 > div:gt(0) > ul > li.item > ul > li.list-item').items()
for i in li:
info = {
'city': i.text().split('\n\n\n')
}
print(info)

代码运行之后,结果如下图所示:

确实一步到位了,很强!原来​​pq​​可以直接请求网页,确实也省事了。主要是那个​​css​​构造还是需要点时间和精力的。

这个地方也还可以使用​​xpath​​提取来实现,代码如下:

import requests
from lxml import etree

res = requests.get(url='www.cditv.cn/list-3894-1.html', headers=headers)
res.encoding = res.apparent_encoding
html = etree.HTML(res.text)
li_lists = html.xpath('/html/body/div[1]/div[2]/div[2]/div[2]/ul/li')
print(len(li_lists))
for li in li_lists:
info = li.xpath('./ul//li//text()')
# shi = li.xpath('./ul//li/h4/text()')
# qu = li.xpath('./ul//li/strong/text()')
# jiedao = li.xpath('./ul//li/br/text()')
print(info)

运行之后,结果如下图所示:

当然了,你还可以使用​​re正则表达式​​和​​bs4​​来提取,这个网页并不难,用来练手还是不错的。

三、总结

大家好,我是皮皮。这篇文章主要盘点一个pyquery库选择器提取案例!如果你还有其他方法,也欢迎大家积极尝试,一起学习,记得分享给我哦。

最后感谢粉丝提问,感谢、在运行过程中给出的思路和代码建议,感谢粉丝、等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

本文共计666个文字,预计阅读时间需要3分钟。

很抱歉,您没有提供需要改写的句子。请提供您希望改写的句子,我将为您改写为一个长尾词的。

大 家 好,我 是 小 皮。一、前言。前 几 天 在 Python 白 银 群 里 有 个 叫 手 中 的 沙 漫 的 群 员 问 了 个 有 关 pyquery 选 择 器 的 问 题,现 在 就 是 这 个 问 题。原 网页 的 信 息 如 下 所 示:

很抱歉,您没有提供需要改写的句子。请提供您希望改写的句子,我将为您改写为一个长尾词的。

大家好,我是皮皮。

一、前言

前几天在Python白银群有个叫的粉丝问了一道关于​​pyquery​​选择器提取的问题,如下图所示。

就像这样:

原网页的信息如下图所示:

实现过程

这里给了一份代码,如下所示:

from pyquery import PyQuery as pq


headers = {
'Accept-Language': 'zh-CN,zh;q=0.9',
'Cache-Control': 'max-age=0',
'Upgrade-Insecure-Requests': '1',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}
html = pq(url='www.cditv.cn/list-3894-1.html', headers=headers)
doc = pq(html)
li = doc('div.style-type3 > div:gt(0) > ul > li.item > ul > li.list-item').items()
for i in li:
info = {
'city': i.text().split('\n\n\n')
}
print(info)

代码运行之后,结果如下图所示:

确实一步到位了,很强!原来​​pq​​可以直接请求网页,确实也省事了。主要是那个​​css​​构造还是需要点时间和精力的。

这个地方也还可以使用​​xpath​​提取来实现,代码如下:

import requests
from lxml import etree

res = requests.get(url='www.cditv.cn/list-3894-1.html', headers=headers)
res.encoding = res.apparent_encoding
html = etree.HTML(res.text)
li_lists = html.xpath('/html/body/div[1]/div[2]/div[2]/div[2]/ul/li')
print(len(li_lists))
for li in li_lists:
info = li.xpath('./ul//li//text()')
# shi = li.xpath('./ul//li/h4/text()')
# qu = li.xpath('./ul//li/strong/text()')
# jiedao = li.xpath('./ul//li/br/text()')
print(info)

运行之后,结果如下图所示:

当然了,你还可以使用​​re正则表达式​​和​​bs4​​来提取,这个网页并不难,用来练手还是不错的。

三、总结

大家好,我是皮皮。这篇文章主要盘点一个pyquery库选择器提取案例!如果你还有其他方法,也欢迎大家积极尝试,一起学习,记得分享给我哦。

最后感谢粉丝提问,感谢、在运行过程中给出的思路和代码建议,感谢粉丝、等人参与学习交流。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。