如何优化JS正则匹配字符串字面量的长尾词表达？

2026-03-30 10:0510阅读0评论SEO资源

内容介绍
文章标签
相关推荐

本文共计1010个文字，预计阅读时间需要5分钟。

昨天在《JS+正则学习小记之匹配字符串字面量》中提到，`//(:\.\|\[\^\]]\|)*/` 是一个正确的表达式，因为它可以满足我们的需求，所以这个表达式可用，但不一定是最好的。从性能上来说，它并不非常高效。

昨天在《js 正则学习小记之匹配字符串字面量》谈到 /"(?:\\.|[^"])*"/ 是个不错的表达式，因为可以满足我们的要求，所以这个表达式可用，但不一定是最好的。
从性能上来说，他非常糟糕，为什么这么说呢，因为传统型NFA引擎遇到分支是从左往右匹配的，
所以它会用 \\. 去匹配每一个字符，发现不对后才用 [^"] 去匹配。
比如这样一个字符串: "123456\'78\"90"
共 16 个字符，除了第一个 " 直接匹配成功，还剩余 15 个，只有 2 个转义(4 个字符)，所以 \\. 会失败 10 次，只有 2 次成功。
这 10 次匹配失败，需要回溯后用 [^"] 才能匹配成功，当然最后一个 " 会直接匹配成功。

很明显，正常的字符串不可能全是转义，正常的字符串才是主流，当然不排除有人故意全转义的情况。
所以这个正则需要10次回溯后才能匹配完成，如果字符串增长到 1K 1M 肿么破呢？
所以我们要修改下这个正则，前后换下位置么？
难道是 /"(?:[^"]|\\.)*"/ ？呵呵，好像不太对，这样的话转义就不能被匹配了。

阅读全文

标签：正则学习小记之匹配

本文共计1010个文字，预计阅读时间需要5分钟。

阅读全文

标签：正则学习小记之匹配

相关推荐

相关推荐