如何用正则表达式匹配多行文本中的长尾关键词?
- 内容介绍
- 文章标签
- 相关推荐
本文共计723个文字,预计阅读时间需要3分钟。
要使用PHP的正则表达式匹配类似以下HTML代码的表格内容:
aaaa bbbb cccc dddd
我们可以使用以下正则表达式:
phppattern: /(.*?)/s
解释:- `` 和 `` 用于匹配表格的开始和结束标签。- `(.*?)` 是一个非贪婪匹配,用于捕获表格内的内容。- `s` 标志(PCRE_DOTALL)允许`.`匹配包括换行符在内的任何字符。
但是,这个正则表达式不能直接匹配到每个``和``标签内的内容。为了匹配每个``和``标签,我们可以使用以下正则表达式:
phppattern: /(.*?)+/s
解释:- `` 和 `` 仍然用于匹配表格的开始和结束标签。- `` 和 `` 用于匹配每一行。- `(.*?)` 用于捕获每行内的内容。- `+` 表示一个或多个重复的行。- `s` 标志允许`.`匹配换行符。
这个正则表达式将匹配包含多个``标签的表格,每个``标签内部包含任意内容,直到遇到第一个``标签。
复制代码 代码如下:<table>
<tr><td>aaaa</td></tr>
<tr><td>bbbb</td></tr>
<tr><td>cccc</td></tr>
<tr><td>dddd</td></tr>
</table>
像这种的文本,用PHP的正则表达式怎么匹配??
我最初的想法:
pattern:"/<tr>[.\n]*?<\/tr>" (这个是错误的)
想法思路:"."能匹配任意非换行字符,使用"[.\n]"组合,使其能够匹配所有的字符(包括换行符),但天有不测风云啊——悲剧了,结果什么都没有!
经过一番啃骨之后写了另一个
pattern:"/<tr>(.|\n)*?<\/tr>" (这个是可以)
将“[]”换成"()",使用“|”做一个或选择,这样就行了(纳闷了,怎么"[]"也是选择方式的就不行???)
网上也有一答案:
PATTEN: "/<tr>.*?<\/tr>/is" (很简洁很方便,赞成此方法)
后记: 怎么"[]"也是选择方式的就不行???你知道的话别忘了告诉小弟一声哦……
[]里的.相当于\.,仔细看正则的说明去吧
涉及到换行一般考虑用模式修正符s
s (PCRE_DOTALL)
如果设置了这个修饰符, 模式中的点号元字符匹配所有字符, 包含换行符. 如果没有这个 修饰符, 点号不匹配换行符.
[]里面的是一些范围或者组合
lz试一下"/<tr>[.]*?<\/tr>/is"这个就知道了,
还有()很强大的
本文共计723个文字,预计阅读时间需要3分钟。
要使用PHP的正则表达式匹配类似以下HTML代码的表格内容:
aaaa bbbb cccc dddd
我们可以使用以下正则表达式:
phppattern: /(.*?)/s
解释:- `` 和 `` 用于匹配表格的开始和结束标签。- `(.*?)` 是一个非贪婪匹配,用于捕获表格内的内容。- `s` 标志(PCRE_DOTALL)允许`.`匹配包括换行符在内的任何字符。
但是,这个正则表达式不能直接匹配到每个``和``标签内的内容。为了匹配每个``和``标签,我们可以使用以下正则表达式:
phppattern: /(.*?)+/s
解释:- `` 和 `` 仍然用于匹配表格的开始和结束标签。- `` 和 `` 用于匹配每一行。- `(.*?)` 用于捕获每行内的内容。- `+` 表示一个或多个重复的行。- `s` 标志允许`.`匹配换行符。
这个正则表达式将匹配包含多个``标签的表格,每个``标签内部包含任意内容,直到遇到第一个``标签。
复制代码 代码如下:<table>
<tr><td>aaaa</td></tr>
<tr><td>bbbb</td></tr>
<tr><td>cccc</td></tr>
<tr><td>dddd</td></tr>
</table>
像这种的文本,用PHP的正则表达式怎么匹配??
我最初的想法:
pattern:"/<tr>[.\n]*?<\/tr>" (这个是错误的)
想法思路:"."能匹配任意非换行字符,使用"[.\n]"组合,使其能够匹配所有的字符(包括换行符),但天有不测风云啊——悲剧了,结果什么都没有!
经过一番啃骨之后写了另一个
pattern:"/<tr>(.|\n)*?<\/tr>" (这个是可以)
将“[]”换成"()",使用“|”做一个或选择,这样就行了(纳闷了,怎么"[]"也是选择方式的就不行???)
网上也有一答案:
PATTEN: "/<tr>.*?<\/tr>/is" (很简洁很方便,赞成此方法)
后记: 怎么"[]"也是选择方式的就不行???你知道的话别忘了告诉小弟一声哦……
[]里的.相当于\.,仔细看正则的说明去吧
涉及到换行一般考虑用模式修正符s
s (PCRE_DOTALL)
如果设置了这个修饰符, 模式中的点号元字符匹配所有字符, 包含换行符. 如果没有这个 修饰符, 点号不匹配换行符.
[]里面的是一些范围或者组合
lz试一下"/<tr>[.]*?<\/tr>/is"这个就知道了,
还有()很强大的

