如何深入探讨Python中的字符编码及文件操作技巧?
- 内容介绍
- 文章标签
- 相关推荐
本文共计586个文字,预计阅读时间需要3分钟。
Python字符编码+目前计算机内存的字符编码都是Unicode,目前国内的Windows操作系统使用的的是gbk。Python2默认的字符编码方式是ASCII,Python3默认的字符编码方式是Unicode。.py文件头部的编码声明为:# coding=utf-8
Python字符编码
目前计算机内存的字符编码都是Unicode,目前国内的windows操作系统采用的是gbk。
python2默认的字符编码方式是ASCII
python3默认的字符编码方式是Unicode
.py文件头部的#coding:utf-8是帮助python识别.py文件的编码方式,故在写.py文件时要注意文件头和文件保存时的编码方式要相同,否则可能会出现乱码
python程序运行过程:
- python的解释器现在内存中启动
- 解释器把要运行的文件以文本文件的形式读进内存
- 解释器按照文件的语法格式解释执行代码
python2和python3程序的运行方式基本相同
python2的解释器在运行程序时,将文件内的代码按照文件头的编码读进内存。例如文件头部的编码是gbk,python2读进内存的时候,直接把文件在硬盘里的gbk二进制编码读进内存。如果在不是以gbk为默认编码的终端输出时,会出现乱码。python2可以在字符串对象前加'u'表示Unicode字符,但是这样就不是str变量了。虽然pyhton2也能支持Unicode编码,但是这就像给python2打了一个大补丁。python2的Unicode对象就是python3str对象。
本文共计586个文字,预计阅读时间需要3分钟。
Python字符编码+目前计算机内存的字符编码都是Unicode,目前国内的Windows操作系统使用的的是gbk。Python2默认的字符编码方式是ASCII,Python3默认的字符编码方式是Unicode。.py文件头部的编码声明为:# coding=utf-8
Python字符编码
目前计算机内存的字符编码都是Unicode,目前国内的windows操作系统采用的是gbk。
python2默认的字符编码方式是ASCII
python3默认的字符编码方式是Unicode
.py文件头部的#coding:utf-8是帮助python识别.py文件的编码方式,故在写.py文件时要注意文件头和文件保存时的编码方式要相同,否则可能会出现乱码
python程序运行过程:
- python的解释器现在内存中启动
- 解释器把要运行的文件以文本文件的形式读进内存
- 解释器按照文件的语法格式解释执行代码
python2和python3程序的运行方式基本相同
python2的解释器在运行程序时,将文件内的代码按照文件头的编码读进内存。例如文件头部的编码是gbk,python2读进内存的时候,直接把文件在硬盘里的gbk二进制编码读进内存。如果在不是以gbk为默认编码的终端输出时,会出现乱码。python2可以在字符串对象前加'u'表示Unicode字符,但是这样就不是str变量了。虽然pyhton2也能支持Unicode编码,但是这就像给python2打了一个大补丁。python2的Unicode对象就是python3str对象。

