如何用Python编写示例代码实现Apriori算法进行关联规则挖掘?

2026-05-16 23:501阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计695个文字,预计阅读时间需要3分钟。

如何用Python编写示例代码实现Apriori算法进行关联规则挖掘?

首先导入包含apriori算法的mlxtend库,并使用apriori进行关联规则分析。具体代码如下:

pythonfrom mlxtend.frequent_patterns import apriorifrom mlxtend.frequent_patterns import association_rules

数据集选择:本示例使用博主数据集data=...

使用apriori算法进行关联规则分析frequent_itemsets=apriori(data, min_support=0.01, use_colnames=True)

获取关联规则rules=association_rules(frequent_itemsets, metric=lift, min_threshold=1)

输出关联规则print(rules)

其中,数据集`data`可以根据实际情况进行替换。参数`min_support`表示最小支持度,可以根据需求进行调整。关联规则中的`metric`参数设置为`lift`,表示提升度。`min_threshold`表示最小阈值,可以根据需求进行调整。

如何用Python编写示例代码实现Apriori算法进行关联规则挖掘?

首先导入包含apriori算法的mlxtend库,

pip install mlxtend

调用apriori进行关联规则分析,具体代码如下,其中数据集选取本博客 “机器学习算法——关联规则” 中的例子,可进行参考,设置最小支持度(min_support)为0.4,最小置信度(min_threshold)为0.1,

最小提升度(lift)为1.0,对数据集进行关联规则分析,

from mlxtend.preprocessing import TransactionEncoder from mlxtend.frequent_patterns import apriori from mlxtend.frequent_patterns import association_rules import pandas as pd df_arr = [['苹果','香蕉','鸭梨'], ['橘子','葡萄','苹果','哈密瓜','火龙果'], ['香蕉','哈密瓜','火龙果','葡萄'], ['橘子','橡胶'], ['哈密瓜','鸭梨','葡萄'] ] #转换为算法可接受模型(布尔值) te = TransactionEncoder() df_tf = te.fit_transform(df_arr) df = pd.DataFrame(df_tf,columns=te.columns_) #设置支持度求频繁项集 frequent_itemsets = apriori(df,min_support=0.4,use_colnames= True) #求关联规则,设置最小置信度为0.15 rules = association_rules(frequent_itemsets,metric = 'confidence',min_threshold = 0.15) #设置最小提升度 rules = rules.drop(rules[rules.lift <1.0].index) #设置标题索引并打印结果 rules.rename(columns = {'antecedents':'from','consequents':'to','support':'sup','confidence':'conf'},inplace = True) rules = rules[['from','to','sup','conf','lift']] print(rules) #rules为Dataframe格式,可根据自身需求存入文件

输出结果如下:

from to sup conf lift 0 (哈密瓜) (火龙果) 0.4 0.666667 1.666667 1 (火龙果) (哈密瓜) 0.4 1.000000 1.666667 2 (哈密瓜) (葡萄) 0.6 1.000000 1.666667 3 (葡萄) (哈密瓜) 0.6 1.000000 1.666667 4 (葡萄) (火龙果) 0.4 0.666667 1.666667 5 (火龙果) (葡萄) 0.4 1.000000 1.666667 6 (哈密瓜, 葡萄) (火龙果) 0.4 0.666667 1.666667 7 (哈密瓜, 火龙果) (葡萄) 0.4 1.000000 1.666667 8 (葡萄, 火龙果) (哈密瓜) 0.4 1.000000 1.666667 9 (哈密瓜) (葡萄, 火龙果) 0.4 0.666667 1.666667 10 (葡萄) (哈密瓜, 火龙果) 0.4 0.666667 1.666667 11 (火龙果) (哈密瓜, 葡萄) 0.4 1.000000 1.666667 Process finished with exit code 0

以上就是python 实现关联规则算法Apriori的示例的详细内容,更多关于python 实现关联规则算法Apriori的资料请关注易盾网络其它相关文章!

标签:

本文共计695个文字,预计阅读时间需要3分钟。

如何用Python编写示例代码实现Apriori算法进行关联规则挖掘?

首先导入包含apriori算法的mlxtend库,并使用apriori进行关联规则分析。具体代码如下:

pythonfrom mlxtend.frequent_patterns import apriorifrom mlxtend.frequent_patterns import association_rules

数据集选择:本示例使用博主数据集data=...

使用apriori算法进行关联规则分析frequent_itemsets=apriori(data, min_support=0.01, use_colnames=True)

获取关联规则rules=association_rules(frequent_itemsets, metric=lift, min_threshold=1)

输出关联规则print(rules)

其中,数据集`data`可以根据实际情况进行替换。参数`min_support`表示最小支持度,可以根据需求进行调整。关联规则中的`metric`参数设置为`lift`,表示提升度。`min_threshold`表示最小阈值,可以根据需求进行调整。

如何用Python编写示例代码实现Apriori算法进行关联规则挖掘?

首先导入包含apriori算法的mlxtend库,

pip install mlxtend

调用apriori进行关联规则分析,具体代码如下,其中数据集选取本博客 “机器学习算法——关联规则” 中的例子,可进行参考,设置最小支持度(min_support)为0.4,最小置信度(min_threshold)为0.1,

最小提升度(lift)为1.0,对数据集进行关联规则分析,

from mlxtend.preprocessing import TransactionEncoder from mlxtend.frequent_patterns import apriori from mlxtend.frequent_patterns import association_rules import pandas as pd df_arr = [['苹果','香蕉','鸭梨'], ['橘子','葡萄','苹果','哈密瓜','火龙果'], ['香蕉','哈密瓜','火龙果','葡萄'], ['橘子','橡胶'], ['哈密瓜','鸭梨','葡萄'] ] #转换为算法可接受模型(布尔值) te = TransactionEncoder() df_tf = te.fit_transform(df_arr) df = pd.DataFrame(df_tf,columns=te.columns_) #设置支持度求频繁项集 frequent_itemsets = apriori(df,min_support=0.4,use_colnames= True) #求关联规则,设置最小置信度为0.15 rules = association_rules(frequent_itemsets,metric = 'confidence',min_threshold = 0.15) #设置最小提升度 rules = rules.drop(rules[rules.lift <1.0].index) #设置标题索引并打印结果 rules.rename(columns = {'antecedents':'from','consequents':'to','support':'sup','confidence':'conf'},inplace = True) rules = rules[['from','to','sup','conf','lift']] print(rules) #rules为Dataframe格式,可根据自身需求存入文件

输出结果如下:

from to sup conf lift 0 (哈密瓜) (火龙果) 0.4 0.666667 1.666667 1 (火龙果) (哈密瓜) 0.4 1.000000 1.666667 2 (哈密瓜) (葡萄) 0.6 1.000000 1.666667 3 (葡萄) (哈密瓜) 0.6 1.000000 1.666667 4 (葡萄) (火龙果) 0.4 0.666667 1.666667 5 (火龙果) (葡萄) 0.4 1.000000 1.666667 6 (哈密瓜, 葡萄) (火龙果) 0.4 0.666667 1.666667 7 (哈密瓜, 火龙果) (葡萄) 0.4 1.000000 1.666667 8 (葡萄, 火龙果) (哈密瓜) 0.4 1.000000 1.666667 9 (哈密瓜) (葡萄, 火龙果) 0.4 0.666667 1.666667 10 (葡萄) (哈密瓜, 火龙果) 0.4 0.666667 1.666667 11 (火龙果) (哈密瓜, 葡萄) 0.4 1.000000 1.666667 Process finished with exit code 0

以上就是python 实现关联规则算法Apriori的示例的详细内容,更多关于python 实现关联规则算法Apriori的资料请关注易盾网络其它相关文章!

标签: