文章也同时在个人博客 http://kimihe.com/更新
概览
本文内容是关于数字表示,存储以及运算的计算机科学。
包含了原理速览以及代码示例。
数的表示
数在计算机中以bit为基本单位,以0和1两种状态组成二进制。通常以8bits组成进一步的字节来计算。习惯上以两个16进制数来表达一个字节。
与十进制一样,每一位的二进制都有各自的权重,是一个二次幂的形式。
整数分为有符号与无符号两种,通常以补码表示。
浮点数由符号,尾数,阶码构成。一般大家可以不用太在意浮点数的具体原理。
数的存储
数字根据其声明的类型,占据对应长度的位数,如int32_t站32bits,4个字节。平时存储于内存中,运算时加载入对应长度的寄存器,供CPU使用。
数的运算
由于一个类型的数取值范围有限,你不能无限制地进行运算操作,当运算结果超出其值域范围,便会产生错误,从这一点看计算机不如人脑“聪明”。
计算机对于数的理解,完全取决于程序员如何规定解释这个数字,如内存中有0x30(0011 0000):
- 如果解释成8位无符号数,那它表示48。
- 如果解释成6位有符号数,那它表示-16。
- 甚至可以将其理解为表示字符的ascii码,它表示字符“0”。
此外,我们想要强调:在C语言这种更接近底层的语言中,我们需要时刻小心数值存储及运算溢出。
如int32_t长度下,范围是:
INT32_MAX: 2147483647
INT32_MIN: -2147483648
虽然数学上:2147483647 = (1<<31) - 1= 65536*65536-1
,但是计算机在计算的时候会产生微妙的问题。
根据int32_t值域,上述三种数值表达方式中的6553665536-1会产生溢出,计算机从左往右依次计算,计算6553665536时就会超过范围,其运算结果为2的32次方0x1 0000 0000,超过最大范围,于是进行数值截断,取后32位,其位0x0000 0000,对应补码解释为0,于是继续运算得到最终错误结果-1**。
因此,想要保证结果正确,除了使用另外两种形式书写,也可以考虑调换数字位置,如使用65536/2*65536-1
,确保中间值不会溢出。
另外例子中没有使用bool类型,因为C没有标准bool定义,可以自定义0为false,!0为true。
代码
笔者给出了一些测试代码,用来强调数的表法范围和运算溢出,代码的地址如下:https://github.com/kimihe/FUN_IN_CS/tree/master/NumberExpression
进一步研究
你可能需要去研究如下知识点:
- 阿贝尔群
- 浮点数
- 数的位表示及运算
- 布尔代数
后话
科研其实还蛮有趣的,一起来钻研计算机与信息科学吧!