如何用PHP正则表达式准确检测字符串中的中文字符?

2026-03-30 08:170阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计411个文字,预计阅读时间需要2分钟。

如何用PHP正则表达式准确检测字符串中的中文字符?

代码中存在一个警告信息:PCRE does not support,这表明PHP正则表达式引擎(PCRE)不支持当前使用的某些字符或模式。

具体来看,问题出在正则表达式 `preg_match(/^[\u4e00-\u9fa5_a-zA-Z0-9]{3,15}$/, $strName);` 中。在PCRE中,`_` 字符不被视为字母字符的一部分,因此不能用于字符类中。

以下是修改后的代码,修正了这个问题:

php

在这个修正中,我使用了Unicode范围表示法 `\x{4e00}-\x{9fa5}` 来匹配中文字符,并且将 `_` 替换为 `\w`(匹配字母、数字和下划线)。这样修改后,正则表达式应该在PCRE引擎中正常工作。

$str = '中华人民共和国123456789abcdefg';
echo preg_match("/^[\u4e00-\u9fa5_a-zA-Z0-9]{3,15}$",$strName);

运行一下上面这段代码,看会有什么提示信息?
Warning: preg_match(): Compilation failed: PCRE does not support \L, \l, \N, \P, \p, \U, \u, or \X at offset 3 in F:\wwwroot\php\test.php on line 2

原来,PHP正则表达式中不支持下列 Perl 转义序列:\L, \l, \N, \P, \p, \U, \u, or \X

在 UTF-8 模式下,允许用“\x{...}”,花括号中的内容是表示十六进制数字的字符串。原来的十六进制转义序列 \xhh 如果其值大于 127 的话则匹配了一个双字节 UTF-8 字符。
阅读全文
标签:问题str

本文共计411个文字,预计阅读时间需要2分钟。

如何用PHP正则表达式准确检测字符串中的中文字符?

代码中存在一个警告信息:PCRE does not support,这表明PHP正则表达式引擎(PCRE)不支持当前使用的某些字符或模式。

具体来看,问题出在正则表达式 `preg_match(/^[\u4e00-\u9fa5_a-zA-Z0-9]{3,15}$/, $strName);` 中。在PCRE中,`_` 字符不被视为字母字符的一部分,因此不能用于字符类中。

以下是修改后的代码,修正了这个问题:

php

在这个修正中,我使用了Unicode范围表示法 `\x{4e00}-\x{9fa5}` 来匹配中文字符,并且将 `_` 替换为 `\w`(匹配字母、数字和下划线)。这样修改后,正则表达式应该在PCRE引擎中正常工作。

$str = '中华人民共和国123456789abcdefg';
echo preg_match("/^[\u4e00-\u9fa5_a-zA-Z0-9]{3,15}$",$strName);

运行一下上面这段代码,看会有什么提示信息?
Warning: preg_match(): Compilation failed: PCRE does not support \L, \l, \N, \P, \p, \U, \u, or \X at offset 3 in F:\wwwroot\php\test.php on line 2

原来,PHP正则表达式中不支持下列 Perl 转义序列:\L, \l, \N, \P, \p, \U, \u, or \X

在 UTF-8 模式下,允许用“\x{...}”,花括号中的内容是表示十六进制数字的字符串。原来的十六进制转义序列 \xhh 如果其值大于 127 的话则匹配了一个双字节 UTF-8 字符。
阅读全文
标签:问题str