如何用Python实现类似awk的字符串分割功能?
- 内容介绍
- 文章标签
- 相关推荐
本文共计602个文字,预计阅读时间需要3分钟。
如果您熟悉Shell中的awk工具,会发现用它来分割字符串非常方便。特别是,当字符串中包含多个连续空格时,awk会将其当作一个单独的空格处理。例如,在处理文本文件时,awk能够轻松地将包含多个连续空格的行分割成单独的字段。这种处理方式特别适用于文本数据清洗和格式转换任务。
若你使用过 Shell 中的 awk 工具,会发现用它来分割字符串是非常方便的。特别是多个连续空格会被当做一个处理。
[root@localhost ~]# cat demo.txt
hello world
[root@localhost ~]#
[root@localhost ~]# awk '{print$1,$2}' demo.txt
hello world
可是转换到 Python 上面来呢?结果可能是这样的。
>>> msg='hello world'
>>> msg.split(' ')
['hello', '', '', '', 'world']
与我预想的结果不符,多个空格会被分割多次。
那有什么办法可以达到 awk 一样的效果呢?
有两种方法。
第一种方法
不加参数,这种只适用于将多个空格当成一个空格处理,如果不是以空格为分隔符的场景,这种就不适用了。
本文共计602个文字,预计阅读时间需要3分钟。
如果您熟悉Shell中的awk工具,会发现用它来分割字符串非常方便。特别是,当字符串中包含多个连续空格时,awk会将其当作一个单独的空格处理。例如,在处理文本文件时,awk能够轻松地将包含多个连续空格的行分割成单独的字段。这种处理方式特别适用于文本数据清洗和格式转换任务。
若你使用过 Shell 中的 awk 工具,会发现用它来分割字符串是非常方便的。特别是多个连续空格会被当做一个处理。
[root@localhost ~]# cat demo.txt
hello world
[root@localhost ~]#
[root@localhost ~]# awk '{print$1,$2}' demo.txt
hello world
可是转换到 Python 上面来呢?结果可能是这样的。
>>> msg='hello world'
>>> msg.split(' ')
['hello', '', '', '', 'world']
与我预想的结果不符,多个空格会被分割多次。
那有什么办法可以达到 awk 一样的效果呢?
有两种方法。
第一种方法
不加参数,这种只适用于将多个空格当成一个空格处理,如果不是以空格为分隔符的场景,这种就不适用了。

