Python入门——编码规范有哪些?
- 内容介绍
- 文章标签
- 相关推荐
本文共计990个文字,预计阅读时间需要4分钟。
编码与ASCII:1字节,0-255,GBK2313:常用汉字,2万多个GBK:对GBK2313的补充,支持藏文,2字节表示一个汉字,big5:台湾,繁体字+Unicode:万国码,2-4字节,只在内存中使用,传输时或转化为其他形式。
编解码
- ASCII:1字节,0-255
- GBK2313:常用的汉字,2万多个
- GBK:对GBK2313的补充,支持藏文,2个字节表示一个汉字
- big5:台湾,繁体字
- unicode:万国码,2-4字节,只是在内存中使用,传输或者保存时要编码
- UTF:Unicode transformation format
- UTF-8:变长,1-4个字节,兼容ASCII,汉字2字节,好处是省空间,但是浪费时间
- UTF-16:2字节
- UTF-32:4字节
总而言之:
- Unicode定义世界每个字符的索引值。
- Unicode编码:包含全世界的所有字符,但是,他只是用来在内存中使用。一旦需要存储到文件或者是网络传输,默认计算机系统不支持unicode。
如果必须要存储到文件或者网络传输时:我们必须用bytes类型(gbk或utf-8编码的bytes类型字符串)。
本文共计990个文字,预计阅读时间需要4分钟。
编码与ASCII:1字节,0-255,GBK2313:常用汉字,2万多个GBK:对GBK2313的补充,支持藏文,2字节表示一个汉字,big5:台湾,繁体字+Unicode:万国码,2-4字节,只在内存中使用,传输时或转化为其他形式。
编解码
- ASCII:1字节,0-255
- GBK2313:常用的汉字,2万多个
- GBK:对GBK2313的补充,支持藏文,2个字节表示一个汉字
- big5:台湾,繁体字
- unicode:万国码,2-4字节,只是在内存中使用,传输或者保存时要编码
- UTF:Unicode transformation format
- UTF-8:变长,1-4个字节,兼容ASCII,汉字2字节,好处是省空间,但是浪费时间
- UTF-16:2字节
- UTF-32:4字节
总而言之:
- Unicode定义世界每个字符的索引值。
- Unicode编码:包含全世界的所有字符,但是,他只是用来在内存中使用。一旦需要存储到文件或者是网络传输,默认计算机系统不支持unicode。
如果必须要存储到文件或者网络传输时:我们必须用bytes类型(gbk或utf-8编码的bytes类型字符串)。

