很抱歉,您没有提供需要改写的句子。请提供您希望改写的句子,我将为您改写为一个长尾词的。
- 内容介绍
- 文章标签
- 相关推荐
本文共计491个文字,预计阅读时间需要2分钟。
家好,我是小助。前些天在Python白银交流群,有个叫冰蛙的群友问了一个Python清洗数据的问题。这里分享一下,一起学习下。
如何才能把pandas Series里的乱七八糟的七八去掉?
大家好,我是皮皮。
一、前言
前几天在Python白银交流群有个叫的粉丝问了一道Python清洗数据的问题,这里拿出来给大家分享下,一起学习下。
如何才能把pandas serise里乱七八糟的字符清理干净呢?
二、解决过程
解答
这里给出了一个示例的代码,使用了apply和lambda和正则表达式,一气呵成,只需要稍微修改下,匹配自己的数据就可以了。
df['主营业务']=df['主营业务'].astype('str').apply(lambda x: re.sub('[0-9+,,.。…、“”^_?::’‘''""()();;!!*?]+', '', x))不过这个是通用的,也会把数字干掉,如果想适配自己的数据,还需要稍微修改下。
这样问题就完美解决了,另外的话,遇到特殊字符什么的,都可以优先使用re.sub或者replace()函数,事半功倍。
三、总结
大家好,我是皮皮。
本文共计491个文字,预计阅读时间需要2分钟。
家好,我是小助。前些天在Python白银交流群,有个叫冰蛙的群友问了一个Python清洗数据的问题。这里分享一下,一起学习下。
如何才能把pandas Series里的乱七八糟的七八去掉?
大家好,我是皮皮。
一、前言
前几天在Python白银交流群有个叫的粉丝问了一道Python清洗数据的问题,这里拿出来给大家分享下,一起学习下。
如何才能把pandas serise里乱七八糟的字符清理干净呢?
二、解决过程
解答
这里给出了一个示例的代码,使用了apply和lambda和正则表达式,一气呵成,只需要稍微修改下,匹配自己的数据就可以了。
df['主营业务']=df['主营业务'].astype('str').apply(lambda x: re.sub('[0-9+,,.。…、“”^_?::’‘''""()();;!!*?]+', '', x))不过这个是通用的,也会把数字干掉,如果想适配自己的数据,还需要稍微修改下。
这样问题就完美解决了,另外的话,遇到特殊字符什么的,都可以优先使用re.sub或者replace()函数,事半功倍。
三、总结
大家好,我是皮皮。

