如何用Python正则表达式解决遇到反斜杠时的匹配难题?

2026-04-20 04:242阅读0评论SEO教程
  • 内容介绍
  • 相关推荐

本文共计623个文字,预计阅读时间需要3分钟。

如何用Python正则表达式解决遇到反斜杠\时的匹配难题?

目录 + 遇到的问题: + 正则表达式 + Python字符串 + 综合概述 + 字符串方法replace() + 总结 + 遇到的问题: + 在做爬虫的时候,爬取的url链接内还有需要转义的字符,如反斜杠+,使用正则的re.sub()替换掉的时候,会遇到问题。

目录
  • 遇到的问题:
  • 正则表达式
  • python字符串
  • 综上
  • 字符串方法replace()
  • 总结

遇到的问题:

在做爬虫的时候,爬取的url链接内还有转义字符,反斜杠 \,打算用正则的re.sub()替换掉的时候遇到了问题,这是要做替换的字符串

最开始直接写

re.sub("\\","",item)

编译器漏红了

然后就是找解决办法,最后发现要用四个反斜杠才可以,也就是使用

re.sub("\\\\","",item)

查了查资料,简单说说我自己的理解。

正则表达式

首先就是正则表达式,对于正则表达式来说,他的语法是独立的,有自己的语法,在正则表达式中,由于反斜杠 \ 是一个特殊字符,可以和其他字母形成转义字符,所以要想表示一个反斜杠 \ 就必须写成 \\ 这种形式。所以对于正则表达式来说,如果要匹配一个\ 就要写成\\,像这样:

如何用Python正则表达式解决遇到反斜杠\时的匹配难题?

python字符串

在python中,如果想要输出一个反斜杠\字符,同样要使用转义:

>>> print("\\") \

同样是因为在python中反斜杠也是一个特殊字符。

综上

当写成

item = "jobs.51job.com/guangzhou-thq/137115906.html?s=sou_sou_soulb&t=0_0' >>>

需要注意的是不论是正则的re.sub()还是str.replace(),使用之后都不会对原始字符串改变:

import re urL ='https:\/\/jobs.51job.com\/guangzhou-thq\/137735415.html?s=sou_sou_soulb&t=0_0' print(urL.replace('\\','')) print(urL) print(re.sub(r'\\','',urL)) print(urL)

总结

到此这篇关于python使用正则表达式匹配反斜杠\遇到问题的文章就介绍到这了,更多相关python正则表达式匹配反斜杠\内容请搜索自由互联以前的文章或继续浏览下面的相关文章希望大家以后多多支持自由互联!

本文共计623个文字,预计阅读时间需要3分钟。

如何用Python正则表达式解决遇到反斜杠\时的匹配难题?

目录 + 遇到的问题: + 正则表达式 + Python字符串 + 综合概述 + 字符串方法replace() + 总结 + 遇到的问题: + 在做爬虫的时候,爬取的url链接内还有需要转义的字符,如反斜杠+,使用正则的re.sub()替换掉的时候,会遇到问题。

目录
  • 遇到的问题:
  • 正则表达式
  • python字符串
  • 综上
  • 字符串方法replace()
  • 总结

遇到的问题:

在做爬虫的时候,爬取的url链接内还有转义字符,反斜杠 \,打算用正则的re.sub()替换掉的时候遇到了问题,这是要做替换的字符串

最开始直接写

re.sub("\\","",item)

编译器漏红了

然后就是找解决办法,最后发现要用四个反斜杠才可以,也就是使用

re.sub("\\\\","",item)

查了查资料,简单说说我自己的理解。

正则表达式

首先就是正则表达式,对于正则表达式来说,他的语法是独立的,有自己的语法,在正则表达式中,由于反斜杠 \ 是一个特殊字符,可以和其他字母形成转义字符,所以要想表示一个反斜杠 \ 就必须写成 \\ 这种形式。所以对于正则表达式来说,如果要匹配一个\ 就要写成\\,像这样:

如何用Python正则表达式解决遇到反斜杠\时的匹配难题?

python字符串

在python中,如果想要输出一个反斜杠\字符,同样要使用转义:

>>> print("\\") \

同样是因为在python中反斜杠也是一个特殊字符。

综上

当写成

item = "jobs.51job.com/guangzhou-thq/137115906.html?s=sou_sou_soulb&t=0_0' >>>

需要注意的是不论是正则的re.sub()还是str.replace(),使用之后都不会对原始字符串改变:

import re urL ='https:\/\/jobs.51job.com\/guangzhou-thq\/137735415.html?s=sou_sou_soulb&t=0_0' print(urL.replace('\\','')) print(urL) print(re.sub(r'\\','',urL)) print(urL)

总结

到此这篇关于python使用正则表达式匹配反斜杠\遇到问题的文章就介绍到这了,更多相关python正则表达式匹配反斜杠\内容请搜索自由互联以前的文章或继续浏览下面的相关文章希望大家以后多多支持自由互联!