如何进行Python文件数据治理与提取分析交流？

2026-05-19 10:351阅读0评论SEO教程

内容介绍
文章标签
相关推荐

本文共计1033个文字，预计阅读时间需要5分钟。

本章节为家长带来了关于Python的相关知识，主要介绍了Python文件数据处理技巧。文章围绕主题展开，详细介绍了Python文件数据提取的具体内容，并附带一定的参考价值，适合需要的小伙伴参考。

本篇文章给大家带来了关于Python的相关知识，主要介绍了python文件数据分析治理提取，文章围绕主题展开详细的内容介绍，具有一定的参考价值，需要的小伙伴可以参考一下。

程序员必备接口测试调试工具：立即使用
Apipost = Postman + Swagger + Mock + Jmeter
Api设计、调试、文档、自动化测试工具
后端、前端、测试，同时在线协作，内容实时同步

前提提要

python2.0有无法直接读取中文路径的问题，需要另外写函数。python3.0在2018年的时候也无法直接读取。

现在使用的时候，发现python3.0是可以直接读取中文路径的。

需要自带或者创建几个txt文件，里面最好写几个数据（姓名，手机号，住址）

要求

写代码的时候最好，自己设几个要求，明确下目的：

需要读取对应目录路径的所有对应文件
按行读取出每个对应txt文件的记录
使用正则表达式获取每行的手机号
将手机号码存储到excel中

思路

1）读取文件
2）读取数据
3）数据整理
4）正则表达式匹配
5）数据去重
6）数据导出保存

代码

import glob import re import xlwt filearray=[] data=[] phone=[] filelocation=glob.glob(r'课堂实训/*.txt') print(filelocation) for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data) combine_data=sum(data,[]) print(combine_data) for a in combine_data: data1=re.search(r'[0-9]{11}',a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone)) #存到excel中 f=xlwt.Workbook('encoding=utf-8') sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save('phonenumber.xls')登录后复制

运行结果

会生成一个excel文件

分析

import glob import re import xlwt登录后复制

globe用来定位文件，re正则表达式，xlwt用于excel

1）读取文件

filelocation=glob.glob(r'课堂实训/*.txt')登录后复制

指定目录下的所有txt文件

2）读取数据

for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data)登录后复制

将路径下的txt文件循环读取，按序号依次读取文件
打开每一次循环对应的文件
将每一次循环的txt文件的数据按行读取出来
使用append()方法将每一行的数据添加到data列表中
输出一下，可以看到将几个txt的文件数据以字列形式存在同一个列表

3）数据整理

combine_data=sum(data,[])登录后复制

列表合并成一个列表

4）正则表达式匹配外加数据去重

print(combine_data) for a in combine_data: data1=re.search(r'[0-9]{11}',a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone))登录后复制

set()函数：无序去重，创建一个无序不重复元素集

6）数据导出保存

#存到excel中 f=xlwt.Workbook('encoding=utf-8') sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save('phonenumber.xls')登录后复制

Workbook('encoding=utf-8')：设置工作簿的编码
add_sheet('sheet1',cell_overwrite_ok=True)：创建对应的工作表
write(x,y,z)：参数对应行、列、值

以上就是一起聊聊python文件数据分析治理提取的详细内容，更多请关注自由互联其它相关文章！

标签：一起聊聊 Python 文件数据分析

本文共计1033个文字，预计阅读时间需要5分钟。

程序员必备接口测试调试工具：立即使用
Apipost = Postman + Swagger + Mock + Jmeter
Api设计、调试、文档、自动化测试工具
后端、前端、测试，同时在线协作，内容实时同步

前提提要

python2.0有无法直接读取中文路径的问题，需要另外写函数。python3.0在2018年的时候也无法直接读取。

现在使用的时候，发现python3.0是可以直接读取中文路径的。

需要自带或者创建几个txt文件，里面最好写几个数据（姓名，手机号，住址）

要求

写代码的时候最好，自己设几个要求，明确下目的：

需要读取对应目录路径的所有对应文件
按行读取出每个对应txt文件的记录
使用正则表达式获取每行的手机号
将手机号码存储到excel中

思路

1）读取文件
2）读取数据
3）数据整理
4）正则表达式匹配
5）数据去重
6）数据导出保存

代码

运行结果

会生成一个excel文件

分析

import glob import re import xlwt登录后复制

globe用来定位文件，re正则表达式，xlwt用于excel

1）读取文件

filelocation=glob.glob(r'课堂实训/*.txt')登录后复制

指定目录下的所有txt文件

2）读取数据

for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data)登录后复制

3）数据整理

combine_data=sum(data,[])登录后复制

列表合并成一个列表

4）正则表达式匹配外加数据去重

print(combine_data) for a in combine_data: data1=re.search(r'[0-9]{11}',a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone))登录后复制

set()函数：无序去重，创建一个无序不重复元素集

6）数据导出保存

#存到excel中 f=xlwt.Workbook('encoding=utf-8') sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save('phonenumber.xls')登录后复制

Workbook('encoding=utf-8')：设置工作簿的编码
add_sheet('sheet1',cell_overwrite_ok=True)：创建对应的工作表
write(x,y,z)：参数对应行、列、值

以上就是一起聊聊python文件数据分析治理提取的详细内容，更多请关注自由互联其它相关文章！

标签：一起聊聊 Python 文件数据分析

前提提要

要求

思路

代码

运行结果

分析

1）读取文件

2）读取数据

3）数据整理

4）正则表达式匹配外加数据去重

6）数据导出保存

相关推荐

前提提要

要求

思路

代码

运行结果

分析

1）读取文件

2）读取数据

3）数据整理

4）正则表达式匹配外加数据去重

6）数据导出保存

相关推荐