如何编写PHP代码识别并过滤长尾词敏感内容?
- 内容介绍
- 文章标签
- 相关推荐
本文共计158个文字,预计阅读时间需要1分钟。
php打开文件 words.txt,将内容存储到数组 $words 中,每个单词用斜杠进行转义。读取 text.txt 文件内容到变量 $text。记录开始时间 $start。构建正则表达式 $reg,包含所有单词,以斜杠开头和结尾。使用 preg_match_all 函数匹配 $text 中的所有匹配项到数组 $m。
$f = file('words.txt'); $words = array(); foreach ($f as $w) { $words[] = preg_quote(trim($w), '/'); } $text = file_get_contents('text.txt'); $start = microtime(true); $reg = '/' . implode('|', $words) . '/S'; preg_match_all($reg, $text, $m); $result = array(); $total = 0; foreach ($m[0] as $w) { if (!isset($result[$w])) { $result[$w] = 1; } else { $result[$w]++; } $total++; } $end = microtime(true); echo $end - $start, "\n"; echo $total, "\n"; print_r($result);
本文共计158个文字,预计阅读时间需要1分钟。
php打开文件 words.txt,将内容存储到数组 $words 中,每个单词用斜杠进行转义。读取 text.txt 文件内容到变量 $text。记录开始时间 $start。构建正则表达式 $reg,包含所有单词,以斜杠开头和结尾。使用 preg_match_all 函数匹配 $text 中的所有匹配项到数组 $m。
$f = file('words.txt'); $words = array(); foreach ($f as $w) { $words[] = preg_quote(trim($w), '/'); } $text = file_get_contents('text.txt'); $start = microtime(true); $reg = '/' . implode('|', $words) . '/S'; preg_match_all($reg, $text, $m); $result = array(); $total = 0; foreach ($m[0] as $w) { if (!isset($result[$w])) { $result[$w] = 1; } else { $result[$w]++; } $total++; } $end = microtime(true); echo $end - $start, "\n"; echo $total, "\n"; print_r($result);

