PHP如何计算两个字符串相似度?
- 内容介绍
- 文章标签
- 相关推荐
本文共计761个文字,预计阅读时间需要4分钟。
在PHP中,计算字符串相似度可以使用`similar_text`函数和`levenshtein`函数。以下是对这两个函数的简要介绍:
- `similar_text($str1, $str2, $percent)`:此函数返回两个字符串的相似度百分比。参数`$percent`是可选的,如果提供,则会直接返回该百分比。
示例代码:php$first=abcdefg;$second=aeg;echo similar_text($first, $second); // 输出:3
- 如果想以百分比形式显示相似度,可以使用`similar_text`函数的第三个参数。
示例代码:php$first=abcdefg;$second=aeg;echo similar_text($first, $second, $percent); // 输出:30
在php计算字符串相似度similar_text与相似度levenshtein函数的详细介绍
$first = "abcdefg";
$second = "aeg";
echo similar_text($first, $second);结果输出3.如果想以百分比显示,则可使用它的第三个参数,如下:
$first = "abcdefg";
$second = "aeg";
similar_text($first, $second, $percent);
echo $percent;
//该代码片段来自于: www.sharejs.com/codes/php/6094 similar_text函数的使用及实现过程。similar_text()函数主要是用来计算两个字符串的匹配字符的数目,也可以计算两个字符串的相似度(以百分比计)。与similar_text()函数相比,我们今天要介绍的levenshtein()函数更快。不过,similar_text()函数能通过更少的必需修改次数提供更精确的结果。在追求速度而少精确度,并且字符串长度有限时可以考虑使用levenshtein()函数。
使用说明
先看手册上levenshtein()函数的说明:
levenshtein()函数返回两个字符串之间的Levenshtein距离。
Levenshtein距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如把kitten转换为sitting:
sitten(k→s)
sittin(e→i)
sitting(→g)levenshtein()函数给每个操作(替换、插入和删除)相同的权重。不过,您可以通过设置可选的insert、replace、delete参数,来定义每个操作的代价。
语法:
levenshtein(string1,string2,insert,replace,delete)
参数描述
•string1必需。要对比的第一个字符串。
•string2必需。要对比的第二个字符串。
•insert可选。插入一个字符的代价。默认是1。
•replace可选。替换一个字符的代价。默认是1。
•delete可选。删除一个字符的代价。默认是1。
提示和注释
•如果其中一个字符串超过255个字符,levenshtein()函数返回-1。
•levenshtein()函数对大小写不敏感。
•levenshtein()函数比similar_text()函数更快。不过,similar_text()函数提供需要更少修改的更精确的结果。
代码例子:
<?php echo levenshtein("Hello World","ello World"); echo "<br />"; echo levenshtein("Hello World","ello World",10,20,30); ?> 输出:130
本文共计761个文字,预计阅读时间需要4分钟。
在PHP中,计算字符串相似度可以使用`similar_text`函数和`levenshtein`函数。以下是对这两个函数的简要介绍:
- `similar_text($str1, $str2, $percent)`:此函数返回两个字符串的相似度百分比。参数`$percent`是可选的,如果提供,则会直接返回该百分比。
示例代码:php$first=abcdefg;$second=aeg;echo similar_text($first, $second); // 输出:3
- 如果想以百分比形式显示相似度,可以使用`similar_text`函数的第三个参数。
示例代码:php$first=abcdefg;$second=aeg;echo similar_text($first, $second, $percent); // 输出:30
在php计算字符串相似度similar_text与相似度levenshtein函数的详细介绍
$first = "abcdefg";
$second = "aeg";
echo similar_text($first, $second);结果输出3.如果想以百分比显示,则可使用它的第三个参数,如下:
$first = "abcdefg";
$second = "aeg";
similar_text($first, $second, $percent);
echo $percent;
//该代码片段来自于: www.sharejs.com/codes/php/6094 similar_text函数的使用及实现过程。similar_text()函数主要是用来计算两个字符串的匹配字符的数目,也可以计算两个字符串的相似度(以百分比计)。与similar_text()函数相比,我们今天要介绍的levenshtein()函数更快。不过,similar_text()函数能通过更少的必需修改次数提供更精确的结果。在追求速度而少精确度,并且字符串长度有限时可以考虑使用levenshtein()函数。
使用说明
先看手册上levenshtein()函数的说明:
levenshtein()函数返回两个字符串之间的Levenshtein距离。
Levenshtein距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如把kitten转换为sitting:
sitten(k→s)
sittin(e→i)
sitting(→g)levenshtein()函数给每个操作(替换、插入和删除)相同的权重。不过,您可以通过设置可选的insert、replace、delete参数,来定义每个操作的代价。
语法:
levenshtein(string1,string2,insert,replace,delete)
参数描述
•string1必需。要对比的第一个字符串。
•string2必需。要对比的第二个字符串。
•insert可选。插入一个字符的代价。默认是1。
•replace可选。替换一个字符的代价。默认是1。
•delete可选。删除一个字符的代价。默认是1。
提示和注释
•如果其中一个字符串超过255个字符,levenshtein()函数返回-1。
•levenshtein()函数对大小写不敏感。
•levenshtein()函数比similar_text()函数更快。不过,similar_text()函数提供需要更少修改的更精确的结果。
代码例子:
<?php echo levenshtein("Hello World","ello World"); echo "<br />"; echo levenshtein("Hello World","ello World",10,20,30); ?> 输出:130

