本文将介绍C语言的指针相关知识.
指针是什么?
指针和其他的int, float等类似, 是一种类型. 有类型就有相应类型的变量和常量. 本文主要讨论变量的情况.
指针变量就是一种变量, 和其他种类的变量类似, 但指针和其他变量又有区别.
首先C语言作为一种类型语言, 每个变量都会有几个属性.
● 变量名称.
● 变量类型.
● 变量的值.
例如int a = 3, 变量名称就是a, 变量类型是int, 变量的值是3, 如果不提供初始值, 那么变量的值可能是一个随机值.
也就是说, 任何时候看到一个变量, 就会有这3个属性.
对于指针变量, 可以认为有4个属性.
● 指针变量的名称.
● 指针变量的类型, 即指针类型.
● 指针变量的值, 即一个地址.
● 指针变量的值所指向的内存里的数据类型. 本文称做"指向类型".
可以看到指针变量的关键在于指针所指向的内存里面数据的类型.
例如int a = 3; int *b = &a; 指针变量名称是b, 指针变量类型是指针, 变量b的值是变量a的内存地址. 变量b所指向的内存的数据类型是int. 指针变量多了一个"变量b所指向的内存的数据类型是int”, 本文将指针变量所指向的内存的数据类型称做指向类型.
任何时候看到一个指针就需要关注4点内容: 名称, 指针类型, 指针值, 指向类型. 搞清楚这几个内容, 就可以弄明白指针怎么回事, 当然还要记忆 一些例外的情形.
类型
对于C语言来说, 搞清楚变量的类型相当重要, 涉及到指针的时候就更加重要. 看到一个指针变量后需要理解其指向类型.
例如char * const * (*next)(), next是一个指针, 那么其指向类型是什么? 这个声明/定义比较复杂, 日常编程可能就会碰到比较 复杂的情况, 所以要搞清楚指针首先要懂得怎么看一个声明/定义的变量的类型.
如果看到一个变量的声明或者定义, 那么就需要弄明白变量的类型. 在<<c专家编程>>这本书中有一部分内容专门讲解怎么分析 一个变量的类型, 值得参考.
理解类型的规则:
1、从变量名称开始读取, 然后依照优先级按顺序处理.
2、优先级从高到低 a. 括号内优先级高. b. 后缀操作符, ()表示一个函数, []表示一个数组. c. 前缀操作符,*表示"指向...的指针"
3、如果const, volatile后面为类型(int, long等), 那么作用于类型, 其他情况下作用于const, volatile左边的指针*.
char * const * (*next)()
按照上面的规则来理解next的类型
1、括号内的优先级最高, 即首先看(*next)
2、next左边为*, 因此next是一个指针类型
3、然后后缀()的优先级更高, 因此next是一个指针, 指向一个函数.
4、接着是const右边的*, 表示next是一个指针, 指向一个函数, 该函数返回值类型为一个指针.
5、char * const看作一个整体为指向字符的常量指针.
整个来说: next是一个指针, 指向一个函数, 函数的返回值也是一个指针, 指向一个类型为char的常量指针.
类型有什么用?
C语言为类型语言, 即每个变量都有类型. 类型在变量的赋值, 函数传参, 编译检查等等方面都会用到.
类型可以确定数据的大小和操作.
例如int a = 3, 那么在内存中会存储一个数据3, 那么对于int类型具体来说.
1、这个数据3会占用4字节(常见32位机器与64位机器上int类型占用4字节). 实际上是有4字节的内存, 内容是0×00000003. 因此int类型就规定了占用的内存大小.
2、对于int类型就可以进行+,-,*,/等操作, 但是不能进行取指针值(*a)的操作. 能够进行什么操作, 也是由类型规定的.
那么对于指针来说, 其指向类型就非常重要, 指向类型就规定了指针的值所指向的内存的数据是什么类型, 也就是占用多大内存, 可以进行什么操作.
sizeof
只要类型确定, 那么便可以用sizeof计算类型占用的内存大小, 这个是编译阶段便可以确定的.
对于指针类型来说, 所有指针类型占用的内存大小基本都是一样的, 例如在32bit的机器上占用4字节, 在64bit的机器上占用8字节.
下面代码的变量a和变量b都是指针类型, 但是指向类型不同. 因此sizeof(a)和sizeof(b)的值相等, 但是sizeof(*a)和sizeof(*b)不相等.
int*a;
double*b;
sizeof(a) ==sizeof(b);
sizeof(*a) !=sizeof(*b);
指针类型的操作
可以对指针变量进行+操作.
double a[3] = {1,2,3};
double *b = a;
printf("b: %p, content: %f\n", b, *b);
printf("b+1: %p, content: %f\n", b+1, *(b+1));
int c[3] = {1,2,3};
int*d = d;
printf("d: %p, content: %d\n", d, *d);
printf("d+1: %p, content: %d\n", d+1, *(d+1));
运行结果:
b:0x7fff5f9ec7e0,content:1.000000
b+1:0x7fff5f9ec7e8,content:2.000000
d:0x7fff5f9ec7d0,content:1
d+1:0x7fff5f9ec7d4,content:2
可以看到b+1的值比b要大8. d+1的值比b要大4. b+1实际上是指向a[1]的内存地址. d+1是指向c[1]的内存地址.
有如下公式成立, 指针做加法后的指针变量值和指向类型占用的内存大小相关.
指针变量 + 数字 = 指针变量值 + 数字 * sizeof(指向类型)
可以看到指向类型除了告诉你指针指向的内存里面的数据类型, 在指针变量的相关运算上也是有用的.
数组类型
数组与指针有一定的相似, 同时又很不一样.
数组与指针的关键区别在于数组名是一个常量(和const常量不同). const常量表示变量的内容不会变化, 实际上还是一个变量. 这里所说的数组名为一个常量, 可以理解数组名称是一个内存地址值, 例如0×7fff5f9ec7d4.
以下面的例子来说, a本身不会占用内存, 占用内存的是a[0], a[1], a[2], 实际上a所表示的这块内存才是数组变量.
int a[10] = {0};
int*b = a;
int(*d)[10]= &a;
int c;
c = a[1];
c = b[1];
那么a[1]和b[1]的区别就在于数组是一个常量, 而不是变量(变量本身需要占用内存).
执行c = a[1]是直接从a表示的内存地址偏移4字节的内存中取数据. 仅包含一次内存读操作.
执行c = b[1]是首先从内存中取出变量b的值, 然后将变量b的值偏移4字节, 然后从这个地址的内存中取数据. 包含2次内存读操作. 第一次是读取变量b的值.
数组的其他几个需要注意的地方:
1、数组名称相当于地址常量, 那么这个地址指向一段内存, 因此这个地址本身会有指向类型, 其指向类型就是数组的元素类型. 例如int a[10], 那么a的指向类型就是int, 因此a+1结果实际上指向a[1].
2、sizeof(a)是计算整个数组的类型.sizeof(*a)是计算其指向类型的大小.
3、可以对数组名进行&a操作(取地址), 实际上&a的指针值和a的指针值一样, 而且也是个地址常量, 但是&a的指向类型 是int [10], 即指向一个包含10个int元素的数组, 所以sizeof(*&a), 计算&a的指向类型的占用内存大小就是40.
4、数组作为函数参数传递后, 在函数内使用等价于指针. 因为函数传参是进行值传递, 相当于有一个指针变量记录数组的地址值.
可以看到有的时候a看作一个数组(例如sizeof(a)是计算数组的内存占用), 有时候a看作一个地址常量(例如计算sizeof(*a)和a+1的时候). 还有的时候完全是比较特殊的使用(例如&a得到的指向类型为int [10]的地址常量).
函数指针
函数名本身也是一个地址常量, 其指向类型为一个函数. 实际指向的是函数在内存中的指令集合的起始位置.
int foo(int a)
{
return a;
}
int(*p_foo)(int a) = foo;
printf("%d, %d, %d\n",sizeof(foo),sizeof(*foo),sizeof(&foo));
printf("%d, %d\n",sizeof(p_foo),sizeof(*p_foo));
输出值如下:
1, 1, 8
8, 1
1、对函数名本身计算类型占用内存大小, 其值为1, 对于函数名的指向类型计算内存占用大小其值也为1.
2、foo, *foo, &foo的类型相同, 但是sizeof(&foo)结果为8.
3、函数指针可以进行多次解引用,*****p_foo == *p_foo = p_foo.
4、函数指针可以进行调用,p_foo(3);
以上几点可以认为是函数的特殊情形, 直接记忆.
可以将函数的指令看作是一个unsigned char []的数组. 这样函数名就好像是一个数组名一样, 都是地址常量, 其指向类型为unsigned char类型. 但是函数指令的数组的长度是未知的, 因此编译器默认输出sizeof(foo)为1, sizeof(*foo)相当于是sizeof(unsigned char)为1.
强制类型转换
很多时候涉及到指针和强制类型转换就会感觉比较麻烦, 实际上只要抓住类型这个关键点也可以很简单.
强制类型转换的关键是一段内存, 这段内存里面的数据你把它当作什么类型来看待.
double a =23.456;
int*b = (int*) &a;
那么变量a有一段内存(8个字节), 里面存储了23.456(按标准浮点格式存储). 然后指针b指向这段内存, 而且指针b的指向类型是int, 因此指针b认为这段内存里面存储的是一个int类型的数据.
最后
每次看到指针的时候, 记住4个特征,不管如何进行类型转换, 多少级指针, 是否包含函数指针等, 看到指针 就思考上面几点点, 尤其是最后两点. 练习多了之后就会发现指针本身不是很难, 难的是怎么判断数据的类型。
对于热爱编程的人来说,物以类聚,人以群分!笔者的专栏有一个编程零基础入门学习交流俱乐部(群),有一群一起学习一起解答的小伙伴很重要,还有学习视频文件,欢迎初学者和正在进阶中的小伙伴们!