ASCII:一个英文字母占一个字节。一个汉字占两个字节。
utf-8:一个英文字符占一个字节。一个中文等于3个字节。
unicode:一个英文等于两个字节,一个中文等于两个字节。
符号:英文标点占一个字节,中文标点占两个字节。
空格
ANSI(ASCII.GB2312.GBK等) 占一个字节。
utf-16: 两个字节。
utf-32:四个字节
utf-8:一个字节
unicode有两个,ucs-2.usc-4
ucs-2相当于utf-16
usc-4相当于utf-32
创建测试文本
echo "Test file thing">test.txt