Python入门——编码规范有哪些?

2026-06-11 06:420阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计990个文字,预计阅读时间需要4分钟。

Python入门——编码规范有哪些?

编码与ASCII:1字节,0-255,GBK2313:常用汉字,2万多个GBK:对GBK2313的补充,支持藏文,2字节表示一个汉字,big5:台湾,繁体字+Unicode:万国码,2-4字节,只在内存中使用,传输时或转化为其他形式。

编解码

  • ASCII:1字节,0-255
  • GBK2313:常用的汉字,2万多个
  • GBK:对GBK2313的补充,支持藏文,2个字节表示一个汉字
  • big5:台湾,繁体字
  • unicode:万国码,2-4字节,只是在内存中使用,传输或者保存时要编码
  • UTF:Unicode transformation format
  • UTF-8:变长,1-4个字节,兼容ASCII,汉字2字节,好处是省空间,但是浪费时间
  • UTF-16:2字节
  • UTF-32:4字节

总而言之:

  • Unicode定义世界每个字符的索引值。
  • Unicode编码:包含全世界的所有字符,但是,他只是用来在内存中使用。一旦需要存储到文件或者是网络传输,默认计算机系统不支持unicode。

如果必须要存储到文件或者网络传输时:我们必须用bytes类型(gbk或utf-8编码的bytes类型字符串)。

阅读全文

本文共计990个文字,预计阅读时间需要4分钟。

Python入门——编码规范有哪些?

编码与ASCII:1字节,0-255,GBK2313:常用汉字,2万多个GBK:对GBK2313的补充,支持藏文,2字节表示一个汉字,big5:台湾,繁体字+Unicode:万国码,2-4字节,只在内存中使用,传输时或转化为其他形式。

编解码

  • ASCII:1字节,0-255
  • GBK2313:常用的汉字,2万多个
  • GBK:对GBK2313的补充,支持藏文,2个字节表示一个汉字
  • big5:台湾,繁体字
  • unicode:万国码,2-4字节,只是在内存中使用,传输或者保存时要编码
  • UTF:Unicode transformation format
  • UTF-8:变长,1-4个字节,兼容ASCII,汉字2字节,好处是省空间,但是浪费时间
  • UTF-16:2字节
  • UTF-32:4字节

总而言之:

  • Unicode定义世界每个字符的索引值。
  • Unicode编码:包含全世界的所有字符,但是,他只是用来在内存中使用。一旦需要存储到文件或者是网络传输,默认计算机系统不支持unicode。

如果必须要存储到文件或者网络传输时:我们必须用bytes类型(gbk或utf-8编码的bytes类型字符串)。

阅读全文