如何用正则表达式匹配多行文本中的长尾关键词?

2026-03-30 08:371阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计723个文字,预计阅读时间需要3分钟。

如何用正则表达式匹配多行文本中的长尾关键词?

要使用PHP的正则表达式匹配类似以下HTML代码的表格内容:

aaaa bbbb cccc dddd

我们可以使用以下正则表达式:

phppattern: /(.*?)/s

解释:- `` 和 `` 用于匹配表格的开始和结束标签。- `(.*?)` 是一个非贪婪匹配,用于捕获表格内的内容。- `s` 标志(PCRE_DOTALL)允许`.`匹配包括换行符在内的任何字符。

但是,这个正则表达式不能直接匹配到每个``和``标签内的内容。为了匹配每个``和``标签,我们可以使用以下正则表达式:

phppattern: /(.*?)+/s

解释:- `` 和 `` 仍然用于匹配表格的开始和结束标签。- `` 和 `` 用于匹配每一行。- `(.*?)` 用于捕获每行内的内容。- `+` 表示一个或多个重复的行。- `s` 标志允许`.`匹配换行符。

这个正则表达式将匹配包含多个``标签的表格,每个``标签内部包含任意内容,直到遇到第一个``标签。

复制代码 代码如下:
<table>
<tr><td>aaaa</td></tr>
<tr><td>bbbb</td></tr>
<tr><td>cccc</td></tr>
<tr><td>dddd</td></tr>
</table>

像这种的文本,用PHP的正则表达式怎么匹配??
  我最初的想法:
  pattern:"/<tr>[.\n]*?<\/tr>"  (这个是错误的)
  想法思路:"."能匹配任意非换行字符,使用"[.\n]"组合,使其能够匹配所有的字符(包括换行符),但天有不测风云啊——悲剧了,结果什么都没有!
  经过一番啃骨之后写了另一个
  pattern:"/<tr>(.|\n)*?<\/tr>"  (这个是可以)
  将“[]”换成"()",使用“|”做一个或选择,这样就行了(纳闷了,怎么"[]"也是选择方式的就不行???)
  网上也有一答案:
  PATTEN: "/<tr>.*?<\/tr>/is"  (很简洁很方便,赞成此方法)

后记: 怎么"[]"也是选择方式的就不行???你知道的话别忘了告诉小弟一声哦……

[]里的.相当于\.,仔细看正则的说明去吧

涉及到换行一般考虑用模式修正符s

s (PCRE_DOTALL)
如果设置了这个修饰符, 模式中的点号元字符匹配所有字符, 包含换行符. 如果没有这个 修饰符, 点号不匹配换行符.

[]里面的是一些范围或者组合
lz试一下"/<tr>[.]*?<\/tr>/is"这个就知道了,
还有()很强大的

如何用正则表达式匹配多行文本中的长尾关键词?

本文共计723个文字,预计阅读时间需要3分钟。

如何用正则表达式匹配多行文本中的长尾关键词?

要使用PHP的正则表达式匹配类似以下HTML代码的表格内容:

aaaa bbbb cccc dddd

我们可以使用以下正则表达式:

phppattern: /(.*?)/s

解释:- `` 和 `` 用于匹配表格的开始和结束标签。- `(.*?)` 是一个非贪婪匹配,用于捕获表格内的内容。- `s` 标志(PCRE_DOTALL)允许`.`匹配包括换行符在内的任何字符。

但是,这个正则表达式不能直接匹配到每个``和``标签内的内容。为了匹配每个``和``标签,我们可以使用以下正则表达式:

phppattern: /(.*?)+/s

解释:- `` 和 `` 仍然用于匹配表格的开始和结束标签。- `` 和 `` 用于匹配每一行。- `(.*?)` 用于捕获每行内的内容。- `+` 表示一个或多个重复的行。- `s` 标志允许`.`匹配换行符。

这个正则表达式将匹配包含多个``标签的表格,每个``标签内部包含任意内容,直到遇到第一个``标签。

复制代码 代码如下:
<table>
<tr><td>aaaa</td></tr>
<tr><td>bbbb</td></tr>
<tr><td>cccc</td></tr>
<tr><td>dddd</td></tr>
</table>

像这种的文本,用PHP的正则表达式怎么匹配??
  我最初的想法:
  pattern:"/<tr>[.\n]*?<\/tr>"  (这个是错误的)
  想法思路:"."能匹配任意非换行字符,使用"[.\n]"组合,使其能够匹配所有的字符(包括换行符),但天有不测风云啊——悲剧了,结果什么都没有!
  经过一番啃骨之后写了另一个
  pattern:"/<tr>(.|\n)*?<\/tr>"  (这个是可以)
  将“[]”换成"()",使用“|”做一个或选择,这样就行了(纳闷了,怎么"[]"也是选择方式的就不行???)
  网上也有一答案:
  PATTEN: "/<tr>.*?<\/tr>/is"  (很简洁很方便,赞成此方法)

后记: 怎么"[]"也是选择方式的就不行???你知道的话别忘了告诉小弟一声哦……

[]里的.相当于\.,仔细看正则的说明去吧

涉及到换行一般考虑用模式修正符s

s (PCRE_DOTALL)
如果设置了这个修饰符, 模式中的点号元字符匹配所有字符, 包含换行符. 如果没有这个 修饰符, 点号不匹配换行符.

[]里面的是一些范围或者组合
lz试一下"/<tr>[.]*?<\/tr>/is"这个就知道了,
还有()很强大的

如何用正则表达式匹配多行文本中的长尾关键词?