统一码/国际通用码(Unicode)为文字系统数字编码之业界标准,由统一码/国际通用码联盟(Unicode Consortium),全球网页有一半以上是用Unicode编码。
Unicode是万维网网页标准的基础,最大的好处就是对於每一个字元提供了一个跨平台语言与程式的统一数码。使原来不同语言文字符号无法在同一文件中出现,和用户遇到乱码的问题获得基本解决。
Unicode编码
将人类自然语言的书写文字符号转换成数字机器能处理的“0”和“1”进行编码
一般而言,Unicode编码的书写表达形式以U+开头,接16进制符
由于各国各地方的的字符集标准不一,导致不同语言符号无法在同一文件显示,为此需要Unicode Consortium对其进行额外的转换
此外,由于编码之间的相容性及应用程序如浏览器的支援不一,会发生编码错误以致显示内容不正确,又称乱码(Mojibake),或甚致是安全漏洞。为此需要Unicode的出现,统一数字编码
Unicode联盟中有一数据库——CLDR(通用区域资料库),协助设备处理世界上所有的语言,为不同的语言和国家提供的术语和格式 ,Unicode CLDR数据库存有不少数据,可以使用XML或JSON格式取用
Unicode与Emoji
表情符号(Emoji)是一种象形文字 (图案符号),用来表达各式各样的东西。Unicode Emoji的支援则需要厂商提供对映的Unicode字型。
例如微笑(Grinning Face)的表情符号😀
不同的厂商提供不同的Unicode字型,微笑的表情符号呈现的效果也不同
😀Grinning Face的多种效果
Unicode与文化政治
任何东西的发展都难以与文化政治脱轨,Unicode自然也是
文化
- Unicode发展史上以及多语互联网上,Unicode支持东亚主要的语言
- Unicode的一个重要的里程碑是统一汉字
统一汉字(Unihan)的特点在于,如是几种语言共享的符号且经同意,是共享同一编码,专用的汉字则否
政治
- 2016年,由於美国枪支暴力的问题,Apple把其枪支的表情符号改成水枪。
- 为了促进性别平等,2016年Unicode 的Emoji委员会同意加入11个表情符号,可以搭配不同的姓别及肤色,排列组合可以产出百多馀的表情符号
Unicode作为非盈利机构,其的成功让电脑使用进入了一个新纪元,并应用于很多新技术。Unicode的运作模式就犹如众包模式,让大众都能参与其中,从中获利与提升价值。