浮点类型
用于表示有小数部分的数值。Java中有两种浮点类型,
类型 | 存储需求 | 取值范围 |
---|---|---|
float | 4bit | 指数部分-2128~2127,有效位数为6~7位 |
double | 8bit | 指数部分-21024~21023,有效位数为15位 |
也可以用16进制表示浮点数值。例如0.125=2-3可以表示成0x1.0p-3。在十六进制表示法中,p表示指数(其基数值为2,十进制中指数e的基数为10),尾数部分采用十六进制,指数采用十进制。
浮点类型结构
看了上面的介绍一定有很多疑问,指数部分,尾数部分是什么?有效位数如何得到?
内存结构
浮点类型数据的范围由指数的位数来决定
- float,4字节,占内存32位,其中包含1位符号位,8位指数位,以及23位尾数位。
- double,8字节,占内存64位,其中包含1位符号位,11位指数位,以及52位尾数位。
float的指数范围为-128~127,double的指数范围为-1024~1023。其中负指数决定了浮点类型所能表示的绝对值最小的非零数,正指数决定了浮点类型所能表示的绝对值最大的数,由此可以看出指数决定了浮点类型的取值范围。
float的范围为-2^128 ~ +2^127,也即-3.40E+38 ~ +3.40E+38;double的范围为-2^1024 ~ +2^1023,也即-1.79E+308 ~ +1.79E+308。
有了指数部分好像还是不知道十进制数在内存中存储的方式,这就涉及到尾数位。
浮点类型在内存中存储的形式是二进制系统的科学计数法。float的尾数部分转换为十进制 2^23 = 8388608,这就代表最多能有7位有效数(而且不能超过8388608),但是6位有效数float肯定能够表示,所以float精度为6~7位。double的尾数部分转换为十进制 2^52 = 4503599627370496,和float一样的道理,得出double精度为15~16。
这个有效位数指的是什么呢?首先来看一下十进制小数科学计数法存储,以1.234为例,那么存储的形式就是1234x10^-4。其中1234就是尾数部分,-4就是指数部分。
那么联想到二进制,以十进制2.25为例,二进制原码就是10.01,转化为二进制科学计数法:1.001x2^1。也就是指数为1,尾数部分为0.001(这里肯定有疑问为什么尾数部分不是1.001而且为什么尾数部分形式不是1001。这是因为浮点数在内存中整数部分始终是1,1.001的形式只需要存储小数点后的数字。而且二进制没有小数点,如果不采用这种形式存储,如何去区分整数部分和小数部分呢),二进制存储尾数原码就是001 0000 0000 0000 0000,指数存储1000 0001(网上有说指数以补码形式存储,也有说移码...僵硬了,但是不管怎样最终达到了了解内存存储形式的目的,初学者就不钻牛角尖了)。
杂技
机器数&真值
一个数在计算机中二进制表示形式,就是这个数的机器数。机器数是带符号的,用最高位放置符号,正数是0,负数是1。例如十进制-3,机器数就是1000 0011。
真值,由于机器数带符号位,并不能直接转换为十进制作为真正的值,所以就有一个概念机器数对应的真正数值就是机器数真值。如1000 0011不能直接转换为十进制131,而是转换为机器数真值-000 0011,然后转换为十进制-3。
原码,补码,反码,移码
一个数存储在计算机中需要一定的编码方式,这就有了原码,补码,反码还有移码...
有没有尼玛???
- 原码,就是十进制的机器数。例如1=0000 0001,-1=1000 0001。
- 反码,正数的补码和原码一样;负数的反码就是原码符号位不变,其余各个位取反。例如1=[0000 0001]原=[0000 0001]反,-1=[1000 0001]原=[1111 1110]反。
- 补码,正数的补码和原码一样;负数的补码就是其反码加1,但是符号位不变。例如-1=[1000 0001]原=[1111 1110]反=[1111 1111]补。
- 移码, 无论正负数,将其补码的符号位取反就行。例如-1=[1000 0001]原=[1111 1110]反=[1111 1111]补=[0111 1111]移。
十进制小数转换其他进制
小数转换各类进制有时候可以获取到有限位数的相应进制数,有时可能会出现位数无限制。这时就取决于业务要求的精度。例如float的精度为7位,那么尾数位就只有23位。所以转换为二进制科学计数法后,小数位数最多位23位。
- 十进制小数转二进制,小数部分乘以2,得到乘积的正数部分和小数部分。整数部分作为二进制的高位,乘积的小数部分继续乘以2,后面得到的正数部分作为低位。直到小数部分为0,或者达到了精度要求。
- 十进制小数转换八进制,和转换二进制相同,只是采用乘8取整的方法。
- 十进制小数转换十六进制,和转换二进制相同,只是采用乘16取整的方法。
举个例子:0.375转换二进制,乘2取整就是0.011B。对应的机器数就是0011 0000B(记住在二进制中没有小数点!)。
那么带整数的十进制浮点数该怎么存储呢?就是利用上面描述的浮点类型存储方式,转换成二进制科学计数法,尾数位存储小数部分,正数部分默认为1。如果超出尾数位数,就截掉(这是不是精度丢失呢?)。
精度丢失
在代码中执行2.0-1.1,得到的值会是0.899999...而并不是0.9。
如果在数值计算中不允许任何舍入误差,应该使用BigDecimal。
public class TestFloatDecimal {
public static void main(String[] args) {
System.out.println("is 0.99999999f == 1f?" + (0.99999999f == 1f));
System.out.println("is 0.9f == 1f?" + (0.9f == 1f));
float f = 2.2f;
System.out.println(f);
double d = f;
System.out.println(d);
f = 2.25f;
d = f;
System.out.println(d);
}
}
测试程序主要测试同类型下精度的丢失和浮点类型转换的精度丢失。运行效果:
同类型精度丢失
在第一个打印语句中float字面量是0.99999999f,有效位数为8位,而float最多位7位,所以四舍五入后,变成1.0。而0.9f没有丢失精度。
不同类型转换精度丢失
分析2.2存储形式,转换二进制10.0011 0011 0011...一直0011循环下去。二进制科学计数法1.0 0011 0011...x2^1。转化为double后,尾数位只有52位,所以只取小数部分高52位。最后打印转换为十进制时,进度丢失。
分析2.25存储形式,转换二进制10.01,二进制科学计数法1.001x2^1。转换为double后符号位和指数位都和float存储时一样,尾数位的改变就是将低29位补0。这样一来打印时转换为十进制不会产生精度丢失。