如何使用Python pandas模块高效操作Excel文件?
- 内容介绍
- 文章标签
- 相关推荐
本文共计741个文字,预计阅读时间需要3分钟。
要安装必要的库并读取数据,请按照以下步骤操作:
1. 确保已安装xlrd、pandas和openpyxl库。
2.导入pandas库。
3.使用pandas读取数据。
python
安装必要的库!pip install xlrd pandas openpyxl导入pandas库import pandas as pd
读取数据data=pd.read_excel('your_file.xlsx')
环境要求
需要安装xlrd和pandas和openpyxl
读取数据
import pandas as pd# 默认读取第一个表单
df = pd.read_excel('demo.xlsx')
data = df.head() # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)import pandas as pd
# 指定读取那个表单
df = pd.read_excel('demo.xlsx', sheet_name='Sheet2')
data = df.head() # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)import pandas as pd
# 通过表单索引指定读取表单
df = pd.read_excel('demo.xlsx', sheet_name=1)
# 同时采用多个表单
df = pd.read_excel('demo.xlsx', sheet_name=['Sheet1', 'Sheet2'])
df = pd.read_excel('demo.xlsx', sheet_name=[0,1])
data = df.values
print("获取到的数据:\n%s" % data)
操作行列
1.读取指定的单行,数据会存在列表里面
import pandas as pddf = pd.read_excel('demo.xlsx')
# 读取第一行数据,注意不含表头
data = df.loc[0].values
print("获取到的数据:\n%s" % data)
2.读取指定的多行,数据会存在嵌套的列表里面
import pandas as pddf = pd.read_excel('demo.xlsx')
data = df.loc[[1,2]].values
print("获取到的数据:\n%s" % data)
3.读取指定的行列
import pandas as pddf = pd.read_excel('demo.xlsx')
# 读取第1行第2列数据
data = df.iloc[1, 2]
print("获取到的数据:\n%s" % data)
4.读取指定的多行多列值
import pandas as pddf = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[[1, 2], ['name', 'data']].values
print("获取到的数据:\n%s" % data)
5.获取所有行的指定列
import pandas as pddf = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[:, ['name', 'data']].values
print("获取到的数据:\n%s" % data)
6.获取行号并打印输出
import pandas as pddf = pd.read_excel('demo.xlsx')
print(df.index.values)
7.获取列名
import pandas as pddf = pd.read_excel('demo.xlsx')
print(df.columns.values)
8.获取指定列的内容
import pandas as pddf = pd.read_excel('demo.xlsx')
print(df['data'].values)
9.把数据转换为字典类型
import pandas as pddf = pd.read_excel('demo.xlsx')
myList = []
for i in df.index.values:
rowData = df.loc[i, ['id', 'name', 'data']].to_dict()
print(rowData)
myList.append(rowData)
print(myList)
10.读取全部信息
import pandas as pddf = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)
print(data)
11.从demo里读出数据,删除掉不符合要求的行,存入另一个excel
import pandas as pddf = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)
for index, row in data.iterrows():
if row[1] != 'haha':
data = data.drop(index, axis=0)
print(data)
data.to_excel('test.xlsx', 'test', index=False)
本文共计741个文字,预计阅读时间需要3分钟。
要安装必要的库并读取数据,请按照以下步骤操作:
1. 确保已安装xlrd、pandas和openpyxl库。
2.导入pandas库。
3.使用pandas读取数据。
python
安装必要的库!pip install xlrd pandas openpyxl导入pandas库import pandas as pd
读取数据data=pd.read_excel('your_file.xlsx')
环境要求
需要安装xlrd和pandas和openpyxl
读取数据
import pandas as pd# 默认读取第一个表单
df = pd.read_excel('demo.xlsx')
data = df.head() # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)import pandas as pd
# 指定读取那个表单
df = pd.read_excel('demo.xlsx', sheet_name='Sheet2')
data = df.head() # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)import pandas as pd
# 通过表单索引指定读取表单
df = pd.read_excel('demo.xlsx', sheet_name=1)
# 同时采用多个表单
df = pd.read_excel('demo.xlsx', sheet_name=['Sheet1', 'Sheet2'])
df = pd.read_excel('demo.xlsx', sheet_name=[0,1])
data = df.values
print("获取到的数据:\n%s" % data)
操作行列
1.读取指定的单行,数据会存在列表里面
import pandas as pddf = pd.read_excel('demo.xlsx')
# 读取第一行数据,注意不含表头
data = df.loc[0].values
print("获取到的数据:\n%s" % data)
2.读取指定的多行,数据会存在嵌套的列表里面
import pandas as pddf = pd.read_excel('demo.xlsx')
data = df.loc[[1,2]].values
print("获取到的数据:\n%s" % data)
3.读取指定的行列
import pandas as pddf = pd.read_excel('demo.xlsx')
# 读取第1行第2列数据
data = df.iloc[1, 2]
print("获取到的数据:\n%s" % data)
4.读取指定的多行多列值
import pandas as pddf = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[[1, 2], ['name', 'data']].values
print("获取到的数据:\n%s" % data)
5.获取所有行的指定列
import pandas as pddf = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[:, ['name', 'data']].values
print("获取到的数据:\n%s" % data)
6.获取行号并打印输出
import pandas as pddf = pd.read_excel('demo.xlsx')
print(df.index.values)
7.获取列名
import pandas as pddf = pd.read_excel('demo.xlsx')
print(df.columns.values)
8.获取指定列的内容
import pandas as pddf = pd.read_excel('demo.xlsx')
print(df['data'].values)
9.把数据转换为字典类型
import pandas as pddf = pd.read_excel('demo.xlsx')
myList = []
for i in df.index.values:
rowData = df.loc[i, ['id', 'name', 'data']].to_dict()
print(rowData)
myList.append(rowData)
print(myList)
10.读取全部信息
import pandas as pddf = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)
print(data)
11.从demo里读出数据,删除掉不符合要求的行,存入另一个excel
import pandas as pddf = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)
for index, row in data.iterrows():
if row[1] != 'haha':
data = data.drop(index, axis=0)
print(data)
data.to_excel('test.xlsx', 'test', index=False)

