对于人来说,C语言中的数据类型有多种,但对于机器来说所有的东西都是0-1代码,各种不同的数据类型在底层是没有差别的,只要编译器允许,任何类型的数据都能强制转换为其他类型。
本文不是一篇纠结于无符号、有符号、源码、补吗、移码、算术移位、逻辑移位等等数据类型转换的各种细节的文章。但,值得指出的是,不同的数据类型在强制转换时,具体如何处理是和编译器有关的,无符号数和有符号数,int型和double型等之间运算的表达式具体如何处理也和编译器有关。总之一句话就是,不要将不同类型的数据放在一起运算,隐式转换的规则不是那么固定的。同时,任何数据类型之间都能进行强制转换,但是不同数据类型之间的强制转换不一定有意义,除非是我们故意如此,否则,最好不要用这个技巧。
3.1 变量
C语言中,任何一个变量都必须占有一个地址,而这个地址空间内的0-1代码就是这个变量的值。不同的数据类型占有的空间大小不一,但是他们都必须有个地址,而这个地址就是硬件访问的依据,而名字只是提供给程序员的一种记住这个地址的方便一点的方法。但是,不同的变量在机器中都是0-1代码,所以,我们不能简单的通过检查一个值的位来判断它的类型。
例如,定义如下:
int a; float b; double c; long double d;(假设它们所占的字节分别是4、8、8、10,而且连续存储于某个地址空间,起始地址是100,则我们可以得到如下内存分布)
a 100~103
b 104~111
c 112~119
d 120 130
a变量就是由以地址100开始到103结束的4个字节内存空间内的0-1代码组成。b变量则是由以地址104开始到112结束的8个字节内存空间内的0-1代码组成。而在机器中,这些内存都是连续的0-1代码,机器并不知道100103是整型而104111是float型,所有这些类型都是编译器告知的。当我们用a时,由于前面把a定义为int型,则编译器知道从a的地址开始向后取4个字节再把它解释成int型。那么(float)a,就是先按照int类型取出该数值,再将该数值按照int to float的规则转换成float型。所以强制类型转换就是按照某个变量的类型取出该变量的值,再按照 类型A to 类型B 的规则进行强制转转换。如果是 A 是常数,则是将该常数按照 常数A to 类型B 的规则进行强制转换。
指针也是一个变量,它自己占据一个4个字节的地址空间(由于程序的寻址空间是2^32次方,即4GB,所以用4个字节表示指针就已经能指向任何程序能够寻址到的空间了,所以指针的大小为4字节),他的值是另一个东西的地址,这个东西可以是普通变量,结构体,还可以是个函数等等。由于,指针的大小是4字节,所以,我们可以将指针强制转换成int型或者其他类型。同样,我们也可以将任何一个常数转换成int型再赋值给指针。所有的指针所占的空间大小都是4字节,他们只是声明的类型不同,他们的值都是地址指向某个东西,他们对于机器来说没有本质差别,他们之间可以进行强制类型转换。
指针 to 指针 的强制类型转换是指将指针所指的内容的类型由原先的类型转换为后面的类型。
例如:
int a = 1;
int *p = &a;
float *p1 = (float*)p;
则p和p1的值都是&a,但是p是将&a地址中的值按照int型变量进行解释,而p1则是将&a地址中的值按照float型变量进行解释。
3.2 void指针
鉴于指针之间这种灵活的强制类型转换的需求和出于简化代码的考虑,ANSI C引入了空指针即void*。void指针又名万能指针,在现在的很多程序中,当参数不确定时就用万能指针代替,这一类的指针在线程\进程函数里特别常见。
ANSI C规定,void指针可以复制给其他任意类型的指针,其他任意类型的指针也可以复制给void指针,他们之间复制不需要强制类型转换。当然任何地址也可以复制给void型指针。我们在《网络编程》中经常会看到accept(socket, (struct sockaddr *)&saddr_c, &lenth)之类的语句在&saddr_c之前需要增加代码(struct sockaddr *)是因为当此函数被设计的时候ANSI C还没有提出void*的概念。所有的地址统一用struct sockaddr类型标识,该函数的第二个参数也是指向struct sockaddr类型的指针,此处是强制类型转换。
当然,在某些编译器中不同类型的指针也可以进行直接赋值,但一般情况下会给出类型不匹配的警告。要求程序员显示的给出指针强制类型转换可以提醒程序员小心使用指针,对于明确程序目的具有一定的好处。
指针是C语言的精华之所在,虽然由它引起的错误常常难以排查,但也正因为有指针的存在才使C语言拥有了灵魂。