Python爬虫(part7)中,如何掌握Xpath的Node节点基础用法?

2026-06-10 22:300阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计1206个文字,预计阅读时间需要5分钟。

Python爬虫(part7)中,如何掌握Xpath的Node节点基础用法?

学习笔记+编辑器:Sublime + PS:由于爬虫接触Xpath,因为HTML的语法和XML很类似,所以这里想探讨Xpath都应适用于HTML。注意,这里我们用python进行解析,会使用lxml模块。

理论部分:

学习笔记

编辑器:Sublime

PS:因为爬虫接触Xpath,由于HTML的语法和XML很类似,所以这里想把Xpath都应用在HTML中。注意,这里我们用python进行分析,会使用lxml模块。

注意:这里的理论部分是关于XML文档的,但是介于HTML和XML的相似性,大家可以自行做类比,有的地方我也会用HTML和XML做类比。



文章目录

  • ​​Xpath简介​​
  • ​​Node节点​​
  • ​​节点之间的关系​​
  • ​​节点的类型​​
  • ​​节点的名字与值​​


Xpath简介

Xpath语言的核心是给出用于从XML文档中查找标记的语法规则,即编写Xpath路径表达式,以便使应用程序更加方便、快捷地从XML文件中检索到所需要的的数据。

阅读全文

本文共计1206个文字,预计阅读时间需要5分钟。

Python爬虫(part7)中,如何掌握Xpath的Node节点基础用法?

学习笔记+编辑器:Sublime + PS:由于爬虫接触Xpath,因为HTML的语法和XML很类似,所以这里想探讨Xpath都应适用于HTML。注意,这里我们用python进行解析,会使用lxml模块。

理论部分:

学习笔记

编辑器:Sublime

PS:因为爬虫接触Xpath,由于HTML的语法和XML很类似,所以这里想把Xpath都应用在HTML中。注意,这里我们用python进行分析,会使用lxml模块。

注意:这里的理论部分是关于XML文档的,但是介于HTML和XML的相似性,大家可以自行做类比,有的地方我也会用HTML和XML做类比。



文章目录

  • ​​Xpath简介​​
  • ​​Node节点​​
  • ​​节点之间的关系​​
  • ​​节点的类型​​
  • ​​节点的名字与值​​


Xpath简介

Xpath语言的核心是给出用于从XML文档中查找标记的语法规则,即编写Xpath路径表达式,以便使应用程序更加方便、快捷地从XML文件中检索到所需要的的数据。

阅读全文