如何使用Python pandas模块高效操作Excel文件?

2026-05-24 17:271阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计741个文字,预计阅读时间需要3分钟。

如何使用Python pandas模块高效操作Excel文件?

要安装必要的库并读取数据,请按照以下步骤操作:

1. 确保已安装xlrd、pandas和openpyxl库。

2.导入pandas库。

3.使用pandas读取数据。

python

安装必要的库!pip install xlrd pandas openpyxl

如何使用Python pandas模块高效操作Excel文件?

导入pandas库import pandas as pd

读取数据data=pd.read_excel('your_file.xlsx')

环境要求

需要安装xlrd和pandas和openpyxl

读取数据

import pandas as pd
# 默认读取第一个表单
df = pd.read_excel('demo.xlsx')
data = df.head() # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)import pandas as pd
# 指定读取那个表单
df = pd.read_excel('demo.xlsx', sheet_name='Sheet2')
data = df.head() # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)import pandas as pd
# 通过表单索引指定读取表单
df = pd.read_excel('demo.xlsx', sheet_name=1)
# 同时采用多个表单
df = pd.read_excel('demo.xlsx', sheet_name=['Sheet1', 'Sheet2'])
df = pd.read_excel('demo.xlsx', sheet_name=[0,1])
data = df.values
print("获取到的数据:\n%s" % data)

操作行列

1.读取指定的单行,数据会存在列表里面

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第一行数据,注意不含表头
data = df.loc[0].values
print("获取到的数据:\n%s" % data)

2.读取指定的多行,数据会存在嵌套的列表里面

import pandas as pd
df = pd.read_excel('demo.xlsx')
data = df.loc[[1,2]].values
print("获取到的数据:\n%s" % data)

3.读取指定的行列

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1行第2列数据
data = df.iloc[1, 2]
print("获取到的数据:\n%s" % data)

4.读取指定的多行多列值

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[[1, 2], ['name', 'data']].values
print("获取到的数据:\n%s" % data)

5.获取所有行的指定列

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[:, ['name', 'data']].values
print("获取到的数据:\n%s" % data)

6.获取行号并打印输出

import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df.index.values)

7.获取列名

import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df.columns.values)

8.获取指定列的内容

import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df['data'].values)

9.把数据转换为字典类型

import pandas as pd
df = pd.read_excel('demo.xlsx')
myList = []
for i in df.index.values:
rowData = df.loc[i, ['id', 'name', 'data']].to_dict()
print(rowData)
myList.append(rowData)
print(myList)

10.读取全部信息

import pandas as pd
df = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)
print(data)

11.从demo里读出数据,删除掉不符合要求的行,存入另一个excel

import pandas as pd

df = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)

for index, row in data.iterrows():
if row[1] != 'haha':
data = data.drop(index, axis=0)
print(data)

data.to_excel('test.xlsx', 'test', index=False)



本文共计741个文字,预计阅读时间需要3分钟。

如何使用Python pandas模块高效操作Excel文件?

要安装必要的库并读取数据,请按照以下步骤操作:

1. 确保已安装xlrd、pandas和openpyxl库。

2.导入pandas库。

3.使用pandas读取数据。

python

安装必要的库!pip install xlrd pandas openpyxl

如何使用Python pandas模块高效操作Excel文件?

导入pandas库import pandas as pd

读取数据data=pd.read_excel('your_file.xlsx')

环境要求

需要安装xlrd和pandas和openpyxl

读取数据

import pandas as pd
# 默认读取第一个表单
df = pd.read_excel('demo.xlsx')
data = df.head() # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)import pandas as pd
# 指定读取那个表单
df = pd.read_excel('demo.xlsx', sheet_name='Sheet2')
data = df.head() # 默认读取前5行数据信息
print("获取到的数据:\n%s" % data)import pandas as pd
# 通过表单索引指定读取表单
df = pd.read_excel('demo.xlsx', sheet_name=1)
# 同时采用多个表单
df = pd.read_excel('demo.xlsx', sheet_name=['Sheet1', 'Sheet2'])
df = pd.read_excel('demo.xlsx', sheet_name=[0,1])
data = df.values
print("获取到的数据:\n%s" % data)

操作行列

1.读取指定的单行,数据会存在列表里面

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第一行数据,注意不含表头
data = df.loc[0].values
print("获取到的数据:\n%s" % data)

2.读取指定的多行,数据会存在嵌套的列表里面

import pandas as pd
df = pd.read_excel('demo.xlsx')
data = df.loc[[1,2]].values
print("获取到的数据:\n%s" % data)

3.读取指定的行列

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1行第2列数据
data = df.iloc[1, 2]
print("获取到的数据:\n%s" % data)

4.读取指定的多行多列值

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[[1, 2], ['name', 'data']].values
print("获取到的数据:\n%s" % data)

5.获取所有行的指定列

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 读取第1\2行第2\3列数据
data = df.loc[:, ['name', 'data']].values
print("获取到的数据:\n%s" % data)

6.获取行号并打印输出

import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df.index.values)

7.获取列名

import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df.columns.values)

8.获取指定列的内容

import pandas as pd
df = pd.read_excel('demo.xlsx')
print(df['data'].values)

9.把数据转换为字典类型

import pandas as pd
df = pd.read_excel('demo.xlsx')
myList = []
for i in df.index.values:
rowData = df.loc[i, ['id', 'name', 'data']].to_dict()
print(rowData)
myList.append(rowData)
print(myList)

10.读取全部信息

import pandas as pd
df = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)
print(data)

11.从demo里读出数据,删除掉不符合要求的行,存入另一个excel

import pandas as pd

df = pd.read_excel('demo.xlsx')
data = pd.DataFrame(df)

for index, row in data.iterrows():
if row[1] != 'haha':
data = data.drop(index, axis=0)
print(data)

data.to_excel('test.xlsx', 'test', index=False)