最简单的说,ASCII编码是1个字节,而Unicode编码通常是两个字节(生僻字的话可能需要用3,4个字节来表示)。
为了节约空间,发明了"可变长编码"的UTF-8编码。
所以,计算机内存中统一使用unicode编码,而存储或传输的时候就转换为UTF-8编码。
参考资料:
字符编码笔记:ASCII,Unicode和UTF-8
阮一峰老师文章的常识性错误之 Unicode 与 UTF-8
廖雪峰python3教程:字符串和编码
最简单的说,ASCII编码是1个字节,而Unicode编码通常是两个字节(生僻字的话可能需要用3,4个字节来表示)。
为了节约空间,发明了"可变长编码"的UTF-8编码。
所以,计算机内存中统一使用unicode编码,而存储或传输的时候就转换为UTF-8编码。
参考资料:
字符编码笔记:ASCII,Unicode和UTF-8
阮一峰老师文章的常识性错误之 Unicode 与 UTF-8
廖雪峰python3教程:字符串和编码