如何用PHP正则表达式准确检测字符串中的中文字符?
- 内容介绍
- 文章标签
- 相关推荐
本文共计411个文字,预计阅读时间需要2分钟。
代码中存在一个警告信息:PCRE does not support,这表明PHP正则表达式引擎(PCRE)不支持当前使用的某些字符或模式。
具体来看,问题出在正则表达式 `preg_match(/^[\u4e00-\u9fa5_a-zA-Z0-9]{3,15}$/, $strName);` 中。在PCRE中,`_` 字符不被视为字母字符的一部分,因此不能用于字符类中。
以下是修改后的代码,修正了这个问题:
php
在这个修正中,我使用了Unicode范围表示法 `\x{4e00}-\x{9fa5}` 来匹配中文字符,并且将 `_` 替换为 `\w`(匹配字母、数字和下划线)。这样修改后,正则表达式应该在PCRE引擎中正常工作。
$str = '中华人民共和国123456789abcdefg';echo preg_match("/^[\u4e00-\u9fa5_a-zA-Z0-9]{3,15}$",$strName);
运行一下上面这段代码,看会有什么提示信息?
Warning: preg_match(): Compilation failed: PCRE does not support \L, \l, \N, \P, \p, \U, \u, or \X at offset 3 in F:\wwwroot\php\test.php on line 2
原来,PHP正则表达式中不支持下列 Perl 转义序列:\L, \l, \N, \P, \p, \U, \u, or \X
在 UTF-8 模式下,允许用“\x{...}”,花括号中的内容是表示十六进制数字的字符串。原来的十六进制转义序列 \xhh 如果其值大于 127 的话则匹配了一个双字节 UTF-8 字符。
本文共计411个文字,预计阅读时间需要2分钟。
代码中存在一个警告信息:PCRE does not support,这表明PHP正则表达式引擎(PCRE)不支持当前使用的某些字符或模式。
具体来看,问题出在正则表达式 `preg_match(/^[\u4e00-\u9fa5_a-zA-Z0-9]{3,15}$/, $strName);` 中。在PCRE中,`_` 字符不被视为字母字符的一部分,因此不能用于字符类中。
以下是修改后的代码,修正了这个问题:
php
在这个修正中,我使用了Unicode范围表示法 `\x{4e00}-\x{9fa5}` 来匹配中文字符,并且将 `_` 替换为 `\w`(匹配字母、数字和下划线)。这样修改后,正则表达式应该在PCRE引擎中正常工作。
$str = '中华人民共和国123456789abcdefg';echo preg_match("/^[\u4e00-\u9fa5_a-zA-Z0-9]{3,15}$",$strName);
运行一下上面这段代码,看会有什么提示信息?
Warning: preg_match(): Compilation failed: PCRE does not support \L, \l, \N, \P, \p, \U, \u, or \X at offset 3 in F:\wwwroot\php\test.php on line 2
原来,PHP正则表达式中不支持下列 Perl 转义序列:\L, \l, \N, \P, \p, \U, \u, or \X
在 UTF-8 模式下,允许用“\x{...}”,花括号中的内容是表示十六进制数字的字符串。原来的十六进制转义序列 \xhh 如果其值大于 127 的话则匹配了一个双字节 UTF-8 字符。

