如何识别dataframe中包含空白的特定行?

2026-04-30 19:470阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计198个文字,预计阅读时间需要1分钟。

如何识别dataframe中包含空白的特定行?

在数据清洗过程中,获得Excel或CSV格式的数据后,通常需要进行清理。假设初步得到的dataframe是df。

1. 找到包含NaN值的行: df[~df.isna().any(axis=1)]

但有时,原始的Excel文件中可能本身就包含NaN值。

数据清洗过程中,得到excel或csv形式的数据后,通常需要进行清理。假设初步获得的dataframe是df。

1、找出NaN值所在的行

df[df.isna().any(axis=1)],可获得含有NaN的行。

但是,有时在原始excel或csv中,如果单元格的值是空白字符,Tab字符等空白字符时,上面的办法无法进一步将这些行筛选出来。

如何识别dataframe中包含空白的特定行?

2、找出NaN值与其它空白字符所在的行

(1)df.replace(to_replace=r'^\s+$',value=None,regex=True,inplace=True)

(2)df[df.isna().any(axis=1)]

标签:数据

本文共计198个文字,预计阅读时间需要1分钟。

如何识别dataframe中包含空白的特定行?

在数据清洗过程中,获得Excel或CSV格式的数据后,通常需要进行清理。假设初步得到的dataframe是df。

1. 找到包含NaN值的行: df[~df.isna().any(axis=1)]

但有时,原始的Excel文件中可能本身就包含NaN值。

数据清洗过程中,得到excel或csv形式的数据后,通常需要进行清理。假设初步获得的dataframe是df。

1、找出NaN值所在的行

df[df.isna().any(axis=1)],可获得含有NaN的行。

但是,有时在原始excel或csv中,如果单元格的值是空白字符,Tab字符等空白字符时,上面的办法无法进一步将这些行筛选出来。

如何识别dataframe中包含空白的特定行?

2、找出NaN值与其它空白字符所在的行

(1)df.replace(to_replace=r'^\s+$',value=None,regex=True,inplace=True)

(2)df[df.isna().any(axis=1)]

标签:数据