Python字符串编码与解码的详细解析是怎样的?
- 内容介绍
- 相关推荐
本文共计963个文字,预计阅读时间需要4分钟。
1. 常用编码:ASCII:仅能表示字母、数字和特殊字符,占一个字节;GBK:国家简体中文字符集和繁体字符集,兼容ASCII,占两个字节;Unicode:可表示全球所有字符,有汉字。
1. 常用的编码
- ASCII:只能表示一些字母,数字和特殊的字符,占一个字节
- GBK:国家简体中文字符集和繁体字符集,兼容ASCII,占两个字节
- Unicode:能够表示全世界上所有的字符,Unicode有人说占4个字节也有人说占2个字节,但中文占2个字节
- UTF-8:Unicode的压缩版,占1~3个字节,其中中文占三个字节
2.补充:计算机表示的单位:
bit: 位,计算机最小的表示单位
bytes:字节,最小的存储单位,1bytes=8bit,1bytes简写成1B
1KB = 1024B
1MB = 1024KB
1GB = 1024MB
1TB = 1024GB
......
3.ASCII编码
ASCII编码是基于拉丁字母一套编码,主要是显示现代英语和其西欧语言,是最早通用的单字节编码系统,具体ASCII对照表如下:
在对照表中需要记住的是大写字母A的编码是65,小写字母a的编码的97即可。
本文共计963个文字,预计阅读时间需要4分钟。
1. 常用编码:ASCII:仅能表示字母、数字和特殊字符,占一个字节;GBK:国家简体中文字符集和繁体字符集,兼容ASCII,占两个字节;Unicode:可表示全球所有字符,有汉字。
1. 常用的编码
- ASCII:只能表示一些字母,数字和特殊的字符,占一个字节
- GBK:国家简体中文字符集和繁体字符集,兼容ASCII,占两个字节
- Unicode:能够表示全世界上所有的字符,Unicode有人说占4个字节也有人说占2个字节,但中文占2个字节
- UTF-8:Unicode的压缩版,占1~3个字节,其中中文占三个字节
2.补充:计算机表示的单位:
bit: 位,计算机最小的表示单位
bytes:字节,最小的存储单位,1bytes=8bit,1bytes简写成1B
1KB = 1024B
1MB = 1024KB
1GB = 1024MB
1TB = 1024GB
......
3.ASCII编码
ASCII编码是基于拉丁字母一套编码,主要是显示现代英语和其西欧语言,是最早通用的单字节编码系统,具体ASCII对照表如下:
在对照表中需要记住的是大写字母A的编码是65,小写字母a的编码的97即可。

