如何筛选出包含GBK或UTF-8编码的中文字符串?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1119个文字,预计阅读时间需要5分钟。
前言:最近在处理游戏敏感词时,发现需要过滤掉除汉字外的其他字符,如数字、符号、英文等。为此,我查阅资料并编写了一个函数。
示例:pythondef filter_sensitive_words(text): # 过滤掉非汉字字符 filtered_text=''.join(filter(lambda x: '\u4e00' <=x <='\u9fff', text)) return filtered_text
测试input_text=Hello, 你好!123output_text=filter_sensitive_words(input_text)print(output_text) # 输出:你好
前言
最近在处理游戏敏感词之类的东西,为了加强屏蔽处理,所以需要过滤掉字符串中的除汉字之外的是其他东西如数字,符号,英文字母等。
本文共计1119个文字,预计阅读时间需要5分钟。
前言:最近在处理游戏敏感词时,发现需要过滤掉除汉字外的其他字符,如数字、符号、英文等。为此,我查阅资料并编写了一个函数。
示例:pythondef filter_sensitive_words(text): # 过滤掉非汉字字符 filtered_text=''.join(filter(lambda x: '\u4e00' <=x <='\u9fff', text)) return filtered_text
测试input_text=Hello, 你好!123output_text=filter_sensitive_words(input_text)print(output_text) # 输出:你好
前言
最近在处理游戏敏感词之类的东西,为了加强屏蔽处理,所以需要过滤掉字符串中的除汉字之外的是其他东西如数字,符号,英文字母等。

