java中的字符采用unicode编码,每个字符占2个字节,最多可以容纳65536个字符,字符即基本类型char,unicode编码,及每一个字符都对应一个数字,一般都是用16进制来表示。
ASCII共有256个
ASCII码占用一个字节,可以有0~255共256个取值。前128个为常用的字符如运算符,字母 ,数字等 键盘上可以显示的后 128个为 特殊字符是键盘上找不到的字符。
ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。
例如A,在ascll中是65占用一个字节是8位,及0100 0001,unicode与ascii相兼容,
A在unicode用16进制表示是/u0041,换成二进制是0000 0000 0100 0001,也就是说ascii主要用十进制表示,unicode主要用16进制表示。
如果想要知道一个字符在Unicode表中的顺序,可以将它转换为int类型,如
public class UnicodeTest {
public static void main(String[] args) {
// TODO Auto-generated method stub
char c='李';
System.out.println("c的unicode编码:"+(int)c);
int num=26446;
System.out.println("unicode编码为26446的字符为: "+(char)num);
}
}
output:
c的unicode编码:26446
unicode编码为26446的字符为李