Pandas数据预处理中,有哪些常用函数可以推荐?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1566个文字,预计阅读时间需要7分钟。
引入Pandas,用于处理和分析相关数据。
一、读取数据文件
1.读取Excel数据文件
1.1 加载Excel表,使用skiprows=1跳过首行【对于Excel文件,首行通常为字段定义(行)】。
引入Pandas,用于有关数据处理和分析的环节。
一、读取数据文件
1 .读取excel数据文件
1.1加载Excel表,使用skiprows=1跳过首行
并指定加载的列,注意数据文件的编码,默认utf-8,常用还有gb2312,根据自身数据而定。
%%timeitraw_pd = pd.read_excel(data_file,,skiprows=1,usecols=[1,2,4],name=['item_id','item_name','price'],encoding='gb2312')
181 ms ± 1.32 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
这里可以为每个执行单元之前加入%%timeit,观察其耗时情况。
本文共计1566个文字,预计阅读时间需要7分钟。
引入Pandas,用于处理和分析相关数据。
一、读取数据文件
1.读取Excel数据文件
1.1 加载Excel表,使用skiprows=1跳过首行【对于Excel文件,首行通常为字段定义(行)】。
引入Pandas,用于有关数据处理和分析的环节。
一、读取数据文件
1 .读取excel数据文件
1.1加载Excel表,使用skiprows=1跳过首行
并指定加载的列,注意数据文件的编码,默认utf-8,常用还有gb2312,根据自身数据而定。
%%timeitraw_pd = pd.read_excel(data_file,,skiprows=1,usecols=[1,2,4],name=['item_id','item_name','price'],encoding='gb2312')
181 ms ± 1.32 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
这里可以为每个执行单元之前加入%%timeit,观察其耗时情况。

