如何通过Python3使用包高效解析读写CSV文件?

2026-05-27 01:001阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计1049个文字,预计阅读时间需要5分钟。

如何通过Python3使用包高效解析读写CSV文件?

CSV(Comma-Separated Values,逗号分隔值)是一种以逗号分隔的文本文件格式,用于存储和交换数据。在CSV文件中,每一行代表一个数据记录,而每个字段值则由逗号分隔。所有值都表现为字符串类型(注意:数字也被视为字符串),以适应不同数据类型的存储需求。

例如,若CSV文件包含中文内容,应使用UTF-8编码进行读写。若需要支持特殊功能,如:

+ %E5%A6%82%E6%9E%9C%E8%A6%81%E6%94%AF%E2%80%9D(例如,如果要支持支持)

则需确保程序能够正确解析和处理这些特殊字符。

CSV(Comma-Separated Values)即逗号分隔值,一种以逗号分隔按行存储的文本文件,所有的值都表现为字符串类型(注意:数字为字符串类型)。

如果CSV中有中文,应以utf-8编码读写,如果要支持Excel查看,应是要用utf-8 with bom格式及utf-8-sig

Python3操作CSV文件使用自带的csv包

reader=csv.reader(f, delimiter=','):用来读取数据,reader为生成器,每次读取一行,每行数据为列表格式,可以通过delimiter参数指定分隔符

writer=csv.writer(f):用来写入数据,按行写入,writer支持writerow(列表)单行写入,和writerows(嵌套列表)批量写入多行,无须手动保存。

当文件中有标题行时,可以使用header=next(reader)先获取到第一行的数据,再进行遍历所有的数据行。
写入时,可以先使用writer.writerow(标题行列表),写入标题行,再使用writer.writerows(多行数据嵌套列表),写入多行数据(也可以逐行写入)。

数据文件data.csv:

name,password
abc,123456
张五,123#456
张#abc123,123456
666,123456
a b,123456

读取示例:

如何通过Python3使用包高效解析读写CSV文件?

import csv with open('data.csv', encoding='utf-8') as f: reader = csv.reader(f) header = next(reader) print(header) for row in reader: print(row)

注意:reader必须在文件打开的上下文中使用,否则文件被关闭后reader无法使用
所有的数字被作为字符串,如果要使用数字格式,应使用int()/float()做相应转换

写入示例:

import csv header = ['name', 'password', 'status'] data = [ ['abc', '123456', 'PASS'], ['张五', '123#456', 'PASS'], ['张#abc123', '123456', 'PASS'], ['666', '123456', 'PASS'], ['a b', '123456', 'PASS'] ] with open('result.csv', 'w', encoding='utf-8', newline='') as f: writer = csv.writer(f) writer.writerow(header) writer.writerows(data)

注意,打开文件时应指定格式为w, 文本写入,不支持wb,二进制写入,当然,也可以使用a/w+/r+

打开文件时,指定不自动添加新行newline='',否则每写入一行就或多一个空行。

如果想写入的文件Excel打开没有乱码,utf-8可以改为utf-8-sig。

结果展示,result.csv内容::

name,password,status
abc,123456,PASS
张五,123#456,PASS
张#abc123,123456,PASS
666,123456,PASS
a b,123456,PASS

使用字典格式的数据:DictReader, DictWriter#

注意数据必须有标题行时才能使用

reader=csv.DictReader(f):直接将标题和每一列数据组装成有序字典(OrderedDict)格式,无须再单独读取标题行
writer=csv.DictWriter(f, 标题行列表):写入时可使用writer.writeheader()写入标题,然后使用writer.writerow(字典格式数据行)或write.writerows(多行数据)

读取示例:

import csv with open('data.csv', encoding='utf-8') as f: reader = csv.DictReader(f) for row in reader: print(row['name'], row['password'])

写入示例:

import csv header = ['name', 'password', 'status'] data = [ {'name':'abc', 'password':'123456', 'status':'PASS'}, {'name':'张五', 'password':'123#456', 'status':'PASS'}, {'name':'张#abc123', 'password':'123456', 'status':'PASS'}, {'name':'666', 'password':'123456', 'status':'PASS'}, {'name':'a b', 'password':'123456', 'status':'PASS'} ] with open('result2.csv', 'w', encoding='utf-8', newline='') as f: writer = csv.DictWriter(f, header) writer.writeheader() writer.writerows(data)

写入结果,同result.csv

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持易盾网络。

本文共计1049个文字,预计阅读时间需要5分钟。

如何通过Python3使用包高效解析读写CSV文件?

CSV(Comma-Separated Values,逗号分隔值)是一种以逗号分隔的文本文件格式,用于存储和交换数据。在CSV文件中,每一行代表一个数据记录,而每个字段值则由逗号分隔。所有值都表现为字符串类型(注意:数字也被视为字符串),以适应不同数据类型的存储需求。

例如,若CSV文件包含中文内容,应使用UTF-8编码进行读写。若需要支持特殊功能,如:

+ %E5%A6%82%E6%9E%9C%E8%A6%81%E6%94%AF%E2%80%9D(例如,如果要支持支持)

则需确保程序能够正确解析和处理这些特殊字符。

CSV(Comma-Separated Values)即逗号分隔值,一种以逗号分隔按行存储的文本文件,所有的值都表现为字符串类型(注意:数字为字符串类型)。

如果CSV中有中文,应以utf-8编码读写,如果要支持Excel查看,应是要用utf-8 with bom格式及utf-8-sig

Python3操作CSV文件使用自带的csv包

reader=csv.reader(f, delimiter=','):用来读取数据,reader为生成器,每次读取一行,每行数据为列表格式,可以通过delimiter参数指定分隔符

writer=csv.writer(f):用来写入数据,按行写入,writer支持writerow(列表)单行写入,和writerows(嵌套列表)批量写入多行,无须手动保存。

当文件中有标题行时,可以使用header=next(reader)先获取到第一行的数据,再进行遍历所有的数据行。
写入时,可以先使用writer.writerow(标题行列表),写入标题行,再使用writer.writerows(多行数据嵌套列表),写入多行数据(也可以逐行写入)。

数据文件data.csv:

name,password
abc,123456
张五,123#456
张#abc123,123456
666,123456
a b,123456

读取示例:

如何通过Python3使用包高效解析读写CSV文件?

import csv with open('data.csv', encoding='utf-8') as f: reader = csv.reader(f) header = next(reader) print(header) for row in reader: print(row)

注意:reader必须在文件打开的上下文中使用,否则文件被关闭后reader无法使用
所有的数字被作为字符串,如果要使用数字格式,应使用int()/float()做相应转换

写入示例:

import csv header = ['name', 'password', 'status'] data = [ ['abc', '123456', 'PASS'], ['张五', '123#456', 'PASS'], ['张#abc123', '123456', 'PASS'], ['666', '123456', 'PASS'], ['a b', '123456', 'PASS'] ] with open('result.csv', 'w', encoding='utf-8', newline='') as f: writer = csv.writer(f) writer.writerow(header) writer.writerows(data)

注意,打开文件时应指定格式为w, 文本写入,不支持wb,二进制写入,当然,也可以使用a/w+/r+

打开文件时,指定不自动添加新行newline='',否则每写入一行就或多一个空行。

如果想写入的文件Excel打开没有乱码,utf-8可以改为utf-8-sig。

结果展示,result.csv内容::

name,password,status
abc,123456,PASS
张五,123#456,PASS
张#abc123,123456,PASS
666,123456,PASS
a b,123456,PASS

使用字典格式的数据:DictReader, DictWriter#

注意数据必须有标题行时才能使用

reader=csv.DictReader(f):直接将标题和每一列数据组装成有序字典(OrderedDict)格式,无须再单独读取标题行
writer=csv.DictWriter(f, 标题行列表):写入时可使用writer.writeheader()写入标题,然后使用writer.writerow(字典格式数据行)或write.writerows(多行数据)

读取示例:

import csv with open('data.csv', encoding='utf-8') as f: reader = csv.DictReader(f) for row in reader: print(row['name'], row['password'])

写入示例:

import csv header = ['name', 'password', 'status'] data = [ {'name':'abc', 'password':'123456', 'status':'PASS'}, {'name':'张五', 'password':'123#456', 'status':'PASS'}, {'name':'张#abc123', 'password':'123456', 'status':'PASS'}, {'name':'666', 'password':'123456', 'status':'PASS'}, {'name':'a b', 'password':'123456', 'status':'PASS'} ] with open('result2.csv', 'w', encoding='utf-8', newline='') as f: writer = csv.DictWriter(f, header) writer.writeheader() writer.writerows(data)

写入结果,同result.csv

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持易盾网络。