Pandas factorize()函数在实战中的应用有哪些技巧?
- 内容介绍
- 文章标签
- 相关推荐
本文共计601个文字,预计阅读时间需要3分钟。
爸爸好,我是皮皮。一、前言,前几天在Python白银行流群里有个叫蛋蛋的粉丝问了一个Pandas处理的问题,这里拿出来给大家分享一下,一起学习下。一开始我都没理解他的意思,因为只说了蛋蛋。
大家好,我是皮皮。
一、前言
前几天在Python白银交流群有个叫的粉丝问了一个Pandas处理的问题,这里拿出来给大家分享下,一起学习下。
一开始我都没理解她的意思,以为只是简单的替换而已,之前给了一个代码,当时也写文章记录了,代码如下:
df
不过很不巧,这个不是她想要的结果,她想要的结果是同样的几个都是1,然后其余的就是2,3,4,我还是没反应过来,不过一下子就get到她的意思了,真是太神了。
二、解决过程
这里给出了解答,使用pd.factorize(data['a'])[0]完美地解决了这个问题。
这个类似于onehot编码,对类型进行了数字编码,如果想要把nan也编码,加一个参数na_sentinel=None。
这样一来,就完美地解决了问题。
本文共计601个文字,预计阅读时间需要3分钟。
爸爸好,我是皮皮。一、前言,前几天在Python白银行流群里有个叫蛋蛋的粉丝问了一个Pandas处理的问题,这里拿出来给大家分享一下,一起学习下。一开始我都没理解他的意思,因为只说了蛋蛋。
大家好,我是皮皮。
一、前言
前几天在Python白银交流群有个叫的粉丝问了一个Pandas处理的问题,这里拿出来给大家分享下,一起学习下。
一开始我都没理解她的意思,以为只是简单的替换而已,之前给了一个代码,当时也写文章记录了,代码如下:
df
不过很不巧,这个不是她想要的结果,她想要的结果是同样的几个都是1,然后其余的就是2,3,4,我还是没反应过来,不过一下子就get到她的意思了,真是太神了。
二、解决过程
这里给出了解答,使用pd.factorize(data['a'])[0]完美地解决了这个问题。
这个类似于onehot编码,对类型进行了数字编码,如果想要把nan也编码,加一个参数na_sentinel=None。
这样一来,就完美地解决了问题。

