如何用csv库计算每家店铺商品评价,剔除最高最低分后求平均分?
- 内容介绍
- 文章标签
- 相关推荐
本文共计975个文字,预计阅读时间需要4分钟。
CSV(逗号分隔值)是一种常用的数据交换格式,用于存储表格数据。它以纯文本形式存储表格数据,其中每行对应一个数据记录,字段值之间通常以逗号分隔。Python中处理CSV文件,常用的库是`csv`,它可以轻松实现CSV文件的读写操作。
以下是一个简单的Python代码示例,展示如何使用`csv`库读取和写入CSV文件:
pythonimport csv
读取CSV文件def read_csv(file_path): with open(file_path, mode='r', encoding='utf-8') as file: reader=csv.reader(file) data=[row for row in reader] return data
写入CSV文件def write_csv(file_path, data): with open(file_path, mode='w', encoding='utf-8', newline='') as file: writer=csv.writer(file) writer.writerows(data)
示例数据data=[ ['姓名', '年龄', '性别'], ['张三', '25', '男'], ['李四', '30', '女']]
写入CSV文件write_csv('example.csv', data)
读取CSV文件data_from_file=read_csv('example.csv')print(data_from_file)
这段代码首先定义了两个函数:`read_csv`用于读取CSV文件,`write_csv`用于写入CSV文件。然后创建了一个示例数据列表,并通过`write_csv`函数将其写入名为`example.csv`的文件中。最后,使用`read_csv`函数读取文件内容并打印出来。
1 CSV
python对CSV文件的读写处理常用CSV库完成。
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。
2 前景知识
2.1 迭代器
迭代器的概念
迭代器(iterator)有时又称光标(cursor)是程序设计的软件设计模式,可在容器对象(container,例如链表或数组)上遍访的接口。
迭代器的特点
python使用迭代器处理CSV文件
将path路径下的文件创建为reader迭代器
reader = csv.reader(open(path, 'rt', encoding='utf-8'))遍历得到迭代器全行的前四列
column1 = [row1[0:4] for row1 in reader]2.2 去掉最大值和最小值
先按照店铺workID将grade添加至temp数组
temp.remove(min(temp)) temp.remove(max(temp))3 问题描述
有很多数据存储在csv文件中,每个店铺有唯一userID,每件商品有唯一的workID,以及评分字段,csv文件按照userID排列,需要将相同userID店铺的不同商品评分进行一个去掉一个最高分和一个最低分求平均值操作。
注意点:
4 完整代码
# 对每家店铺的所有商品评价,去掉一个最高分和一个最低分求平均值 def total_work(path): reader = csv.reader(open(path, 'rt', encoding='utf-8')) column1 = [row1[0:4] for row1 in reader] print("共有" + str(reader.line_num - 1) + "件作品。") i = 1 with open("total_"+path, 'w', encoding='UTF8', newline='') as f1: writer1 = csv.writer(f1) writer1.writerow(["realname", "userID", "grade", "num"]) # 写入标题 while i <= reader.line_num - 1: # 作品数 j = 1 # 得分 grade = 0 # 所有作品得分的数组 temp = [float(column1[i][3])] while column1[i][1] == column1[i + 1][1]: # 判断userID店铺是否相同 i = i + 1 temp.append(float(column1[i][3])) j = j + 1 # 数组中添加统一参赛者的作品得分 if i == reader.line_num - 1: # 判断是否为最后一个商品评价 break # 去掉最小值 去掉最大值 求平均 temp.remove(min(temp)) temp.remove(max(temp)) grade = "%.3f"%(sum(temp)/(j-2)) # grade = round(temp/(j),5) # 写入平均分 column1[i][2] = grade # 写入作品数量 # column1[i].append(j) column1[i][3] = j # 存入csv writer1.writerow(column1[i]) i = i + 1本文共计975个文字,预计阅读时间需要4分钟。
CSV(逗号分隔值)是一种常用的数据交换格式,用于存储表格数据。它以纯文本形式存储表格数据,其中每行对应一个数据记录,字段值之间通常以逗号分隔。Python中处理CSV文件,常用的库是`csv`,它可以轻松实现CSV文件的读写操作。
以下是一个简单的Python代码示例,展示如何使用`csv`库读取和写入CSV文件:
pythonimport csv
读取CSV文件def read_csv(file_path): with open(file_path, mode='r', encoding='utf-8') as file: reader=csv.reader(file) data=[row for row in reader] return data
写入CSV文件def write_csv(file_path, data): with open(file_path, mode='w', encoding='utf-8', newline='') as file: writer=csv.writer(file) writer.writerows(data)
示例数据data=[ ['姓名', '年龄', '性别'], ['张三', '25', '男'], ['李四', '30', '女']]
写入CSV文件write_csv('example.csv', data)
读取CSV文件data_from_file=read_csv('example.csv')print(data_from_file)
这段代码首先定义了两个函数:`read_csv`用于读取CSV文件,`write_csv`用于写入CSV文件。然后创建了一个示例数据列表,并通过`write_csv`函数将其写入名为`example.csv`的文件中。最后,使用`read_csv`函数读取文件内容并打印出来。
1 CSV
python对CSV文件的读写处理常用CSV库完成。
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。
2 前景知识
2.1 迭代器
迭代器的概念
迭代器(iterator)有时又称光标(cursor)是程序设计的软件设计模式,可在容器对象(container,例如链表或数组)上遍访的接口。
迭代器的特点
python使用迭代器处理CSV文件
将path路径下的文件创建为reader迭代器
reader = csv.reader(open(path, 'rt', encoding='utf-8'))遍历得到迭代器全行的前四列
column1 = [row1[0:4] for row1 in reader]2.2 去掉最大值和最小值
先按照店铺workID将grade添加至temp数组
temp.remove(min(temp)) temp.remove(max(temp))3 问题描述
有很多数据存储在csv文件中,每个店铺有唯一userID,每件商品有唯一的workID,以及评分字段,csv文件按照userID排列,需要将相同userID店铺的不同商品评分进行一个去掉一个最高分和一个最低分求平均值操作。
注意点:

