跳转至

20. 字符编码

汉字编码(只讲两种)

    问题
        十个汉字占多少字节?
            20个 (gbk编码)
            20个 (utf-8编码)   
国标编码
    GB18020 (二字节或四字节编码 27533个字)
         GBK(二字节编码    21003个字)
            GB2312(二字节编码 6763个字)
    (Windows常用)
国际标准
    UNICODE   <--------> UTF-8
    (Linux / Max OS X / IOS / Android常用)    
UTF-8

​ (8-bit Unicode Transformation Format)

python 的编码(encode)字符串

    'gb2312'
    'gbk'
    'gb18030'
    'utf-8'
    'ascii'

编码注释

 在源文件的第一行或第二行写入如下内容为编码注释
    # -*- coding:gbk -*-
    # 设置源文件格式为gbk
    或
    # -*- coding:utf-8 -*-
    # 设置源文件格式为utf-8
    或
    # coding='utf-8'

    作用
        告诉解释执行器,当前的.py文件的编码格式是什么