程序员左手敲代码,右手为何会烫烫烫?

2026-04-30 20:410阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计681个文字,预计阅读时间需要3分钟。

程序员左手敲代码,右手为何会烫烫烫?

实际上锟斤拷/烫烫烫/屯屯屯/锘锘锘都是字符集转换之间的问题,一些特定用途的字节在另一种字符集编码表现为这些特殊字符。

接下来,让我们一一看看它们的来历。

程序员左手敲代码,右手为何会烫烫烫?

锟斤拷

起源于 GBK 字符集于 Unicode 字符集之间的转换。众所周知,Unicode 是现在最为通用的编码方式之一,它与其它一些老编码体系进行转换时,一定存在一些 Unicode 无法表示的字(因为 Unicode 设计的时候并未完全兼容所有的编码体系,而且也没有必要),所以 Unicode 官方使用了一个占位符来表示这些无法表示的文字,即:U+FFFD (REPLACEMENT CHARATER),这样我们考察 U+FFFD 的 UTF-8 编码表示,是"0xef0xbf0xbd",如果重复多次,如"0xef0xbf0xbd0xef0xbf0xbd",然后在 GBK/CP936/GB2312/GB18030 字符集中解码的话,一个汉字两个字节,最终结果就是锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)。

阅读全文

本文共计681个文字,预计阅读时间需要3分钟。

程序员左手敲代码,右手为何会烫烫烫?

实际上锟斤拷/烫烫烫/屯屯屯/锘锘锘都是字符集转换之间的问题,一些特定用途的字节在另一种字符集编码表现为这些特殊字符。

接下来,让我们一一看看它们的来历。

程序员左手敲代码,右手为何会烫烫烫?

锟斤拷

起源于 GBK 字符集于 Unicode 字符集之间的转换。众所周知,Unicode 是现在最为通用的编码方式之一,它与其它一些老编码体系进行转换时,一定存在一些 Unicode 无法表示的字(因为 Unicode 设计的时候并未完全兼容所有的编码体系,而且也没有必要),所以 Unicode 官方使用了一个占位符来表示这些无法表示的文字,即:U+FFFD (REPLACEMENT CHARATER),这样我们考察 U+FFFD 的 UTF-8 编码表示,是"0xef0xbf0xbd",如果重复多次,如"0xef0xbf0xbd0xef0xbf0xbd",然后在 GBK/CP936/GB2312/GB18030 字符集中解码的话,一个汉字两个字节,最终结果就是锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)。

阅读全文