如何用Python实现Excel表格内容的模糊匹配归类?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1589个文字,预计阅读时间需要7分钟。
问题描述:在实习期间,需要将两个表格的内容进行匹配分类,例如,将针对不同工程项目的对象都归类到A类中,那么就需要将这两个工程项目归入A当中间,而当前的工程项目和施工人员属于同一工程项目。
在实习的时候,需要将两个表格的内容进行匹配分类,比如两个不同的工程项目针对的对象都是A,那么就需要将这两个工程项目归类到A当中,而这当中的工程项目和施工对象数量都还挺多的,因此想着写个程序来自动将它们归类起来,这样可以减少很大一部分的工作量。
二、运用方法由于两个表格中拥有相似的关键词,即一个表格的内容形式为为A工程项目,另一个表格的内容形式为A单位,那么我就需要将其中的“A”这个关键词相匹配就能够筛选出来了。在此问题中,我采用了模糊匹配算法来实现目标,而这个算法并非唯一的可行方案。
三、代码编写注:这里我们导入了difflib库,用于使用模糊匹配算法;xlwt库,用于导出excel表格
3.1首先我们导入两个需要处理的excel表格。
df1=pd.read_excel(r'D:\杂货\项目.xlsx',sheet_name='Sheet1') df2=pd.read_excel(r'D:\杂货\项目2.xlsx',sheet_name='Sheet1')#导入两个需要处理的excel表格
两个表格的内容形式大致如上。而我的需求是将这两个表格相关的工程项目匹配归类。
3.2再将我们所要处理的两列数据放入一个列表当中。
本文共计1589个文字,预计阅读时间需要7分钟。
问题描述:在实习期间,需要将两个表格的内容进行匹配分类,例如,将针对不同工程项目的对象都归类到A类中,那么就需要将这两个工程项目归入A当中间,而当前的工程项目和施工人员属于同一工程项目。
在实习的时候,需要将两个表格的内容进行匹配分类,比如两个不同的工程项目针对的对象都是A,那么就需要将这两个工程项目归类到A当中,而这当中的工程项目和施工对象数量都还挺多的,因此想着写个程序来自动将它们归类起来,这样可以减少很大一部分的工作量。
二、运用方法由于两个表格中拥有相似的关键词,即一个表格的内容形式为为A工程项目,另一个表格的内容形式为A单位,那么我就需要将其中的“A”这个关键词相匹配就能够筛选出来了。在此问题中,我采用了模糊匹配算法来实现目标,而这个算法并非唯一的可行方案。
三、代码编写注:这里我们导入了difflib库,用于使用模糊匹配算法;xlwt库,用于导出excel表格
3.1首先我们导入两个需要处理的excel表格。
df1=pd.read_excel(r'D:\杂货\项目.xlsx',sheet_name='Sheet1') df2=pd.read_excel(r'D:\杂货\项目2.xlsx',sheet_name='Sheet1')#导入两个需要处理的excel表格
两个表格的内容形式大致如上。而我的需求是将这两个表格相关的工程项目匹配归类。
3.2再将我们所要处理的两列数据放入一个列表当中。

