如何用Python移除数据中的u0000u0001等Unicode空白字符?
- 内容介绍
- 文章标签
- 相关推荐
本文共计201个文字,预计阅读时间需要1分钟。
将Python文件编码设置为UTF-8格式
py文件为utf-8格式
#!/usr/bin/env python # -*- coding:utf-8 -*- a = "system\u0000" b = re.sub(u'\u0000', "", a) print(b) ## b="system"
补充知识:Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符
类似于:
\u3232\u6674 的字符串,转换为对应的unicode字符。
对应的,可以通过Python的decode函数去解码,其中自定原始字符串位unicode-ecape,就可以了。
本文共计201个文字,预计阅读时间需要1分钟。
将Python文件编码设置为UTF-8格式
py文件为utf-8格式
#!/usr/bin/env python # -*- coding:utf-8 -*- a = "system\u0000" b = re.sub(u'\u0000', "", a) print(b) ## b="system"
补充知识:Python中,如何将反斜杠u类型(\uXXXX)的字符串,转换为对应的unicode的字符
类似于:
\u3232\u6674 的字符串,转换为对应的unicode字符。
对应的,可以通过Python的decode函数去解码,其中自定原始字符串位unicode-ecape,就可以了。

