如何用正则表达式的贪婪和懒惰模式匹配长尾词?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1052个文字,预计阅读时间需要5分钟。
正则表达式贪婪匹配模式,对于初学者,往往也容易出错。有时需要匹配一段代码内容,发现匹配结果与预期不一致。这可能与贪婪模式有关。例如,以下例子:
+ 什么是贪婪?
贪婪匹配是指正则表达式在匹配时,总是尽可能多地匹配字符。与它相对的是非贪婪匹配,后者尽可能少地匹配字符。
在正则表达式中,贪婪匹配通常通过在量词后面加上一个问号来实现,例如:
* .*
这个表达式会尽可能多地匹配任意字符。如果使用贪婪匹配,那么 abc 会匹配 a,abc 会匹配 abc,而 aabc 会匹配 aabc。
然而,有时候我们可能不希望贪婪匹配,而是希望尽可能少地匹配字符。这时,可以使用非贪婪匹配,例如:
* .*?
这个表达式会尽可能少地匹配任意字符。使用非贪婪匹配,abc 会匹配 a,abc 会匹配 ab,而 aabc 会匹配 aa。
正则表达式贪婪匹配模式,对于初学者,往往也很容易出错。有时候需要匹配一个段代码内容,发现匹配与想要不一致。发现原来,跟贪婪模式有关系。如下,我们看下例子:
什么是贪婪模式
字符串有: “<h3>abd</h3><h3>bcd</h3>”,我们想匹配<h3>…</h3>内容,正则表达式如下:
1、h3开头与结尾,”<h3>待添加</h3>” <h3></h3>都作为普通字符
2、中间可以出现任意字符,个数可以是0个或者多个,正则表达式可以用:.* ,“.”代表任意字符,默认模式不匹配换行,”*” 重复前面字符0个或者多个。
本文共计1052个文字,预计阅读时间需要5分钟。
正则表达式贪婪匹配模式,对于初学者,往往也容易出错。有时需要匹配一段代码内容,发现匹配结果与预期不一致。这可能与贪婪模式有关。例如,以下例子:
+ 什么是贪婪?
贪婪匹配是指正则表达式在匹配时,总是尽可能多地匹配字符。与它相对的是非贪婪匹配,后者尽可能少地匹配字符。
在正则表达式中,贪婪匹配通常通过在量词后面加上一个问号来实现,例如:
* .*
这个表达式会尽可能多地匹配任意字符。如果使用贪婪匹配,那么 abc 会匹配 a,abc 会匹配 abc,而 aabc 会匹配 aabc。
然而,有时候我们可能不希望贪婪匹配,而是希望尽可能少地匹配字符。这时,可以使用非贪婪匹配,例如:
* .*?
这个表达式会尽可能少地匹配任意字符。使用非贪婪匹配,abc 会匹配 a,abc 会匹配 ab,而 aabc 会匹配 aa。
正则表达式贪婪匹配模式,对于初学者,往往也很容易出错。有时候需要匹配一个段代码内容,发现匹配与想要不一致。发现原来,跟贪婪模式有关系。如下,我们看下例子:
什么是贪婪模式
字符串有: “<h3>abd</h3><h3>bcd</h3>”,我们想匹配<h3>…</h3>内容,正则表达式如下:
1、h3开头与结尾,”<h3>待添加</h3>” <h3></h3>都作为普通字符
2、中间可以出现任意字符,个数可以是0个或者多个,正则表达式可以用:.* ,“.”代表任意字符,默认模式不匹配换行,”*” 重复前面字符0个或者多个。

