如何用preg_match_all()提取长尾词?

2026-04-06 10:051阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计1063个文字,预计阅读时间需要5分钟。

如何用preg_match_all()提取长尾词?

PHP中,`preg_match_all()`函数用于执行一个全局正则表达式匹配,可以搜索字符串中所有匹配正则表达式的结果。该函数的语法为`preg_match_all(pattern, subject, matches, flags, offset)`。

本教程操作环境:PHP开发环境。

如何用preg_match_all()提取长尾词?

phppattern: 正则表达式模式,用于匹配的内容。subject: 要搜索的字符串。matches: 用于存储匹配结果的数组。flags: 可选的标志,用于控制匹配行为。offset: 可选的偏移量,用于指定匹配的起始位置。

php中,preg_match_all()函数用于执行一个全局正则表达式匹配,可以搜索字符串中所有可以和正则表达式匹配的结果,语法“preg_match_all(pattern,subject,matches,flags,offset)”。

本教程操作环境:windows7系统、PHP7.1版,DELL G3电脑

preg_match_all()函数可以搜索字符串中所有可以和正则表达式匹配的结果,语法格式如下:

preg_match_all(pattern,subject,matches,flags,offset)

参数说明如下:

  • pattern:要搜索的模式,也就是定义好的正则表达式;
  • subject:要搜索的字符串;
  • matches:可选参数(多维数组),用来存放所有匹配的结果, 数组排序通过 $flags 指定;
  • flags:可选参数,可以结合下面几个标记使用(注意不能同时使用 PREG_PATTERN_ORDER 和 PREG_SET_ORDER):
    • PREG_PATTERN_ORDER:结果排序为 $matches[0] 保存完整模式的所有匹配,$matches[1] 保存第一个子组的所有匹配,以此类推。
    • PREG_SET_ORDER:结果排序为 $matches[0] 包含第一次匹配得到的所有匹配(包含子组), $matches[1] 是包含第二次匹配到的所有匹配(包含子组)的数组,以此类推。
    • PREG_OFFSET_CAPTURE:如果这个标记被传递,每个发现的匹配返回时会增加它相对目标字符串的偏移量。注意这会改变 $matches 中的每一个匹配结果字符串元素,使其成为一个第 0 个元素为匹配结果字符串,第 1 个元素为匹配结果字符串在 subject 中的偏移量。
  • offset:可选参数,$offset 用于从目标字符串中指定位置开始搜索(单位是字节)。

preg_match_all() 函数可以返回 pattern 的匹配次数(可能是 0),如果发生错误则返回 FALSE。

示例1:使用 preg_match_all() 函数匹配一个字符串。

<?php $subject = "abcdefghijkdefabcedfdefxyzdef"; $pattern_1 = '/(def)(abc)/'; $num_1 = preg_match_all($pattern_1, $subject, $matches_1,PREG_PATTERN_ORDER); echo "<pre>"; var_dump($matches_1); var_dump($num_1); $pattern_2 = '/(def)(abc)/'; $num_2 = preg_match_all($pattern_2, $subject, $matches_2,PREG_OFFSET_CAPTURE, 3); var_dump($matches_2); var_dump($num_2); ?>

运行结果如下:

array(3) { [0]=>array(1) { [0]=>string(6) "defabc" } [1]=>array(1) { [0]=>string(3) "def" } [2]=>array(1) { [0]=>string(3) "abc" } } int(1) array(3) { [0]=>array(1) { [0]=>array(2) { [0]=>string(6) "defabc" [1]=>int(11) } } [1]=>array(1) { [0]=>array(2) { [0]=>string(3) "def" [1]=>int(11) } } [2]=>array(1) { [0]=>array(2) { [0]=>string(3) "abc" [1]=>int(14) } } } int(1)

示例2:查找匹配的HTML标签(贪婪):

<?php //\\2是一个后向引用的示例. 这会告诉pcre它必须匹配正则表达式中第二个圆括号(这里是([\w]+)) //匹配到的结果. 这里使用两个反斜线是因为这里使用了双引号. $html = "<b>bold text</b><a href=howdy.html>click me</a>"; preg_match_all("/(<([\w]+)[^>]*>)(.*?)(<\/\\2>)/", $html, $matches, PREG_SET_ORDER); foreach ($matches as $val) { echo "matched: " . $val[0] . "\n"; echo "part 1: " . $val[1] . "\n"; echo "part 2: " . $val[2] . "\n"; echo "part 3: " . $val[3] . "\n"; echo "part 4: " . $val[4] . "\n\n"; } ?>

执行结果如下所示:

matched: <b>bold text</b> part 1: <b> part 2: b part 3: bold text part 4: </b> matched: <a href=howdy.html>click me</a> part 1: <a href=howdy.html> part 2: a part 3: click me part 4: </a>

本文共计1063个文字,预计阅读时间需要5分钟。

如何用preg_match_all()提取长尾词?

PHP中,`preg_match_all()`函数用于执行一个全局正则表达式匹配,可以搜索字符串中所有匹配正则表达式的结果。该函数的语法为`preg_match_all(pattern, subject, matches, flags, offset)`。

本教程操作环境:PHP开发环境。

如何用preg_match_all()提取长尾词?

phppattern: 正则表达式模式,用于匹配的内容。subject: 要搜索的字符串。matches: 用于存储匹配结果的数组。flags: 可选的标志,用于控制匹配行为。offset: 可选的偏移量,用于指定匹配的起始位置。

php中,preg_match_all()函数用于执行一个全局正则表达式匹配,可以搜索字符串中所有可以和正则表达式匹配的结果,语法“preg_match_all(pattern,subject,matches,flags,offset)”。

本教程操作环境:windows7系统、PHP7.1版,DELL G3电脑

preg_match_all()函数可以搜索字符串中所有可以和正则表达式匹配的结果,语法格式如下:

preg_match_all(pattern,subject,matches,flags,offset)

参数说明如下:

  • pattern:要搜索的模式,也就是定义好的正则表达式;
  • subject:要搜索的字符串;
  • matches:可选参数(多维数组),用来存放所有匹配的结果, 数组排序通过 $flags 指定;
  • flags:可选参数,可以结合下面几个标记使用(注意不能同时使用 PREG_PATTERN_ORDER 和 PREG_SET_ORDER):
    • PREG_PATTERN_ORDER:结果排序为 $matches[0] 保存完整模式的所有匹配,$matches[1] 保存第一个子组的所有匹配,以此类推。
    • PREG_SET_ORDER:结果排序为 $matches[0] 包含第一次匹配得到的所有匹配(包含子组), $matches[1] 是包含第二次匹配到的所有匹配(包含子组)的数组,以此类推。
    • PREG_OFFSET_CAPTURE:如果这个标记被传递,每个发现的匹配返回时会增加它相对目标字符串的偏移量。注意这会改变 $matches 中的每一个匹配结果字符串元素,使其成为一个第 0 个元素为匹配结果字符串,第 1 个元素为匹配结果字符串在 subject 中的偏移量。
  • offset:可选参数,$offset 用于从目标字符串中指定位置开始搜索(单位是字节)。

preg_match_all() 函数可以返回 pattern 的匹配次数(可能是 0),如果发生错误则返回 FALSE。

示例1:使用 preg_match_all() 函数匹配一个字符串。

<?php $subject = "abcdefghijkdefabcedfdefxyzdef"; $pattern_1 = '/(def)(abc)/'; $num_1 = preg_match_all($pattern_1, $subject, $matches_1,PREG_PATTERN_ORDER); echo "<pre>"; var_dump($matches_1); var_dump($num_1); $pattern_2 = '/(def)(abc)/'; $num_2 = preg_match_all($pattern_2, $subject, $matches_2,PREG_OFFSET_CAPTURE, 3); var_dump($matches_2); var_dump($num_2); ?>

运行结果如下:

array(3) { [0]=>array(1) { [0]=>string(6) "defabc" } [1]=>array(1) { [0]=>string(3) "def" } [2]=>array(1) { [0]=>string(3) "abc" } } int(1) array(3) { [0]=>array(1) { [0]=>array(2) { [0]=>string(6) "defabc" [1]=>int(11) } } [1]=>array(1) { [0]=>array(2) { [0]=>string(3) "def" [1]=>int(11) } } [2]=>array(1) { [0]=>array(2) { [0]=>string(3) "abc" [1]=>int(14) } } } int(1)

示例2:查找匹配的HTML标签(贪婪):

<?php //\\2是一个后向引用的示例. 这会告诉pcre它必须匹配正则表达式中第二个圆括号(这里是([\w]+)) //匹配到的结果. 这里使用两个反斜线是因为这里使用了双引号. $html = "<b>bold text</b><a href=howdy.html>click me</a>"; preg_match_all("/(<([\w]+)[^>]*>)(.*?)(<\/\\2>)/", $html, $matches, PREG_SET_ORDER); foreach ($matches as $val) { echo "matched: " . $val[0] . "\n"; echo "part 1: " . $val[1] . "\n"; echo "part 2: " . $val[2] . "\n"; echo "part 3: " . $val[3] . "\n"; echo "part 4: " . $val[4] . "\n\n"; } ?>

执行结果如下所示:

matched: <b>bold text</b> part 1: <b> part 2: b part 3: bold text part 4: </b> matched: <a href=howdy.html>click me</a> part 1: <a href=howdy.html> part 2: a part 3: click me part 4: </a>