如何用Python正则表达式解决遇到反斜杠时的匹配难题?
- 内容介绍
- 相关推荐
本文共计623个文字,预计阅读时间需要3分钟。
目录 + 遇到的问题: + 正则表达式 + Python字符串 + 综合概述 + 字符串方法replace() + 总结 + 遇到的问题: + 在做爬虫的时候,爬取的url链接内还有需要转义的字符,如反斜杠+,使用正则的re.sub()替换掉的时候,会遇到问题。
目录
- 遇到的问题:
- 正则表达式
- python字符串
- 综上
- 字符串方法replace()
- 总结
遇到的问题:
在做爬虫的时候,爬取的url链接内还有转义字符,反斜杠 \,打算用正则的re.sub()替换掉的时候遇到了问题,这是要做替换的字符串
最开始直接写
re.sub("\\","",item)
编译器漏红了
然后就是找解决办法,最后发现要用四个反斜杠才可以,也就是使用
re.sub("\\\\","",item)
查了查资料,简单说说我自己的理解。
正则表达式
首先就是正则表达式,对于正则表达式来说,他的语法是独立的,有自己的语法,在正则表达式中,由于反斜杠 \ 是一个特殊字符,可以和其他字母形成转义字符,所以要想表示一个反斜杠 \ 就必须写成 \\ 这种形式。
本文共计623个文字,预计阅读时间需要3分钟。
目录 + 遇到的问题: + 正则表达式 + Python字符串 + 综合概述 + 字符串方法replace() + 总结 + 遇到的问题: + 在做爬虫的时候,爬取的url链接内还有需要转义的字符,如反斜杠+,使用正则的re.sub()替换掉的时候,会遇到问题。
目录
- 遇到的问题:
- 正则表达式
- python字符串
- 综上
- 字符串方法replace()
- 总结
遇到的问题:
在做爬虫的时候,爬取的url链接内还有转义字符,反斜杠 \,打算用正则的re.sub()替换掉的时候遇到了问题,这是要做替换的字符串
最开始直接写
re.sub("\\","",item)
编译器漏红了
然后就是找解决办法,最后发现要用四个反斜杠才可以,也就是使用
re.sub("\\\\","",item)
查了查资料,简单说说我自己的理解。
正则表达式
首先就是正则表达式,对于正则表达式来说,他的语法是独立的,有自己的语法,在正则表达式中,由于反斜杠 \ 是一个特殊字符,可以和其他字母形成转义字符,所以要想表示一个反斜杠 \ 就必须写成 \\ 这种形式。

