推荐文章:
网页编码就是那点事
Unicode 和 UTF-8 有何区别?
编码
缩写 | 全称 | 含义 |
---|---|---|
Ascii | American Standard Code for Information Interchange | 美国信息互换标准代码 |
DBCS | Double Byte Charecter Set | 双字节字符集 |
UCS | Universal Multiple-Octet Coded Character Set | 简称unicode |
UTF | UCS Transfer Format | UTF-8是其一种实现 |
URL编码 | URL encoding | 也称为‘百分号编码’ |
个人理解:
URL编码实际是将字符的
ASCII
表中的值转为16进制,如果遇到中文,默认根据GBK
取该值的16进制。
获取到16进制之后,再从右到左,取4位(不足4位直接处理),每2位做一位,前面加上%
,编码成%XY
格式。
如中文字:“许”,对应的GBK
16进制编码为:D0ED
,如果通过urlencode
编码转换的话就是:%D0%ED
。
另外,urlencode
遇到空格的话是转义成+
。base64
和urlencode
都是一种编码规则,或者说是编码算法。而以上的unicode、ASCII、utf
等都是对世界上现有的一些字符取了外号(一 一编码),就如同一本超大的计算机届的字典,一个字符对应一个外号(码、数值),这样不同国界的人,就可以通过这统一的规则进行无障碍交流了。