如何用Python Selenium通过Xpath进行元素定位?

2026-05-16 15:241阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计559个文字,预计阅读时间需要3分钟。

如何用Python Selenium通过Xpath进行元素定位?

以上是常见的情境,存在可定位的属性,当某个元素的各个属性及其组合不足以定位时,我们可以利用其兄弟节点或父节点等可定位元素进行定位。先看看xpath中支持的定位方式:


以上是普通的情况,存在可以定位的属性,当某个元素的各个属性及其组合都不足以定位时,我们可以利用其兄弟节点或者父节点等各种可以定位的元素进行定位,先看看xpath中支持的方法:

如何用Python Selenium通过Xpath进行元素定位?

、child 选取当前节点的所有子元素

、parent 选取当前节点的父节点

、descendant选取当前节点的所有后代元素(子、孙等)

、ancestor 选取当前节点的所有先辈(父、祖父等)

、descendant-or-self选取当前节点的所有后代元素(子、孙等)以及当前节点本身

、ancestor-or-self 选取当前节点的所有先辈(父、祖父等)以及当前节点本身

、preceding-sibling选取当前节点之前的所有同级节点

、following-sibling选取当前节点之后的所有同级节点

、preceding 选取文档中当前节点的开始标签之前的所有节点

、following 选取文档中当前节点的结束标签之后的所有节点

、self 选取当前节点

、attribute 选取当前节点的所有属性

、namespace选取当前节点的所有命名空间节点




from selenium import webdriver
driver = webdriver.PhantomJS()
driver.get("www.readnovel.com/free/all?pageNum=1&pageSize=10&gender=1&catId=20001&isFinish=1&isVip=1&size=-1&updT=-1&orderBy=0")

# getPage_text = driver.find_element_by_class_name('lbf-pagination-item-list').find_element_by_xpath("li/a[@class='lbf-pagination-next ']").get_attribute("innerHTML")
# 打印 >

# getPage_text = driver.find_element_by_class_name('lbf-pagination-item-list').find_element_by_xpath("li/a[@class='lbf-pagination-next ']/parent::li[1]").get_attribute("innerHTML")
# 打印 <a href="javascript:;" class="lbf-pagination-next ">></a>

getPage_text = driver.find_element_by_class_name('lbf-pagination-item-list').find_element_by_xpath("li/a[@class='lbf-pagination-next ']/parent::li[1]/preceding-sibling::li[1]").get_attribute("innerHTML")
# 打印 <a data-page="108" href="javascript:;" class="lbf-pagination-page ">108</a>

getPage_text = driver.find_element_by_class_name('lbf-pagination-item-list').find_element_by_xpath("li/a[@class='lbf-pagination-next ']/parent::li[1]/preceding-sibling::li[1]/descendant::a[1]").get_attribute("innerHTML")
print(getPage_text) # 打印 108





本文共计559个文字,预计阅读时间需要3分钟。

如何用Python Selenium通过Xpath进行元素定位?

以上是常见的情境,存在可定位的属性,当某个元素的各个属性及其组合不足以定位时,我们可以利用其兄弟节点或父节点等可定位元素进行定位。先看看xpath中支持的定位方式:


以上是普通的情况,存在可以定位的属性,当某个元素的各个属性及其组合都不足以定位时,我们可以利用其兄弟节点或者父节点等各种可以定位的元素进行定位,先看看xpath中支持的方法:

如何用Python Selenium通过Xpath进行元素定位?

、child 选取当前节点的所有子元素

、parent 选取当前节点的父节点

、descendant选取当前节点的所有后代元素(子、孙等)

、ancestor 选取当前节点的所有先辈(父、祖父等)

、descendant-or-self选取当前节点的所有后代元素(子、孙等)以及当前节点本身

、ancestor-or-self 选取当前节点的所有先辈(父、祖父等)以及当前节点本身

、preceding-sibling选取当前节点之前的所有同级节点

、following-sibling选取当前节点之后的所有同级节点

、preceding 选取文档中当前节点的开始标签之前的所有节点

、following 选取文档中当前节点的结束标签之后的所有节点

、self 选取当前节点

、attribute 选取当前节点的所有属性

、namespace选取当前节点的所有命名空间节点




from selenium import webdriver
driver = webdriver.PhantomJS()
driver.get("www.readnovel.com/free/all?pageNum=1&pageSize=10&gender=1&catId=20001&isFinish=1&isVip=1&size=-1&updT=-1&orderBy=0")

# getPage_text = driver.find_element_by_class_name('lbf-pagination-item-list').find_element_by_xpath("li/a[@class='lbf-pagination-next ']").get_attribute("innerHTML")
# 打印 >

# getPage_text = driver.find_element_by_class_name('lbf-pagination-item-list').find_element_by_xpath("li/a[@class='lbf-pagination-next ']/parent::li[1]").get_attribute("innerHTML")
# 打印 <a href="javascript:;" class="lbf-pagination-next ">></a>

getPage_text = driver.find_element_by_class_name('lbf-pagination-item-list').find_element_by_xpath("li/a[@class='lbf-pagination-next ']/parent::li[1]/preceding-sibling::li[1]").get_attribute("innerHTML")
# 打印 <a data-page="108" href="javascript:;" class="lbf-pagination-page ">108</a>

getPage_text = driver.find_element_by_class_name('lbf-pagination-item-list').find_element_by_xpath("li/a[@class='lbf-pagination-next ']/parent::li[1]/preceding-sibling::li[1]/descendant::a[1]").get_attribute("innerHTML")
print(getPage_text) # 打印 108