float、double精度丢失

2022-10-21 16:01:11

　　都知道十进制整数转换二进制( / 2)，十进制小数转换二进制( * 2 取整)，但小数有时乘不尽。

结论：

（1）整数永远可以用二进制精确表示

（2）小数的二进制表示有时是不可能精确的

正如十进制不法表示1/3, 二进制也无法表示1/10；这也就解释了为什么浮点型减法出现了”减不尽”的精度丢失问题

而有时浮点数加减时小数点最后几位出现了意外数字，

这是因为浮点数所在内存的表示形式，符合IEEE754标准。

float内存存储结构

4bytes      31           30           29----23       22----0         

         表示       实数符号位    指数符号位        指数位          有效数位

    其中符号位1表示正，0表示负。有效位数位24位，其中一位是实数符号位。



     将一个float型转化为内存存储格式的步骤为：

 （1）先将这个实数的绝对值化为二进制格式，注意实数的整数部分和小数部分的二进制方法在上面已经探讨过了。 
 （2）将这个二进制格式实数的小数点左移或右移n位，直到小数点移动到第一个有效数字的右边。 
 （3）从小数点右边第一位开始数出二十三位数字放入第22到第0位。 
 （4）如果实数是正的，则在第31位放入“0”，否则放入“1”。 
 （5）如果n 是左移得到的，说明指数是正的，第30位放入“1”。如果n是右移得到的或n=0，则第30位放入“0”。 
 （6）如果n是左移得到的，则将n减去1后化为二进制，并在左边加“0”补足七位，放入第29到第23位。如果n是右移得到的或n=0，则将n化为二进制后在左边加“0”补足七位，再各位求反，再放入第29到第23位。



      举例说明： 11.9的内存存储格式

   (1) 将11.9化为二进制后大约是" 1011. 1110011001100110011001100..."。

   (2) 将小数点左移三位到第一个有效位右侧： "1. 011 11100110011001100110 "。 保证有效位数24位，右侧多余的截取（误差在这里产生了 ）。

   (3) 这已经有了二十四位有效数字，将最左边一位“1”去掉，得到“ 011 11100110011001100110 ”共23bit。将它放入float存储结构的第22到第0位。

   (4) 因为11.9是正数，因此在第31位实数符号位放入“0”。

   (5) 由于我们把小数点左移，因此在第30位指数符号位放入“1”。

   (6) 因为我们是把小数点左移3位，因此将3减去1得2，化为二进制，并补足7位得到0000010，放入第29到第23位。



       最后表示11.9为： 0 1 0000010 011 11100110011001100110

可检验:

float f = 11.9f;
int i = Float.floatToIntBits(f);
System.out.println(Integer.toBinaryString(i));

手动练习一个。

float、double精度丢失

都知道十进制整数转换二进制( / 2)，十进制小数转换二进制( * 2 取整)，但小数有时乘不尽。

结论：

（1）整数永远可以用二进制精确表示

（2）小数的二进制表示有时是不可能精确的

正如十进制不法表示1/3, 二进制也无法表示1/10；这也就解释了为什么浮点型减法出现了”减不尽”的精度丢失问题

而有时浮点数加减时小数点最后几位出现了意外数字，

这是因为浮点数所在内存的表示形式，符合IEEE754标准。

float内存存储结构

可检验:

手动练习一个。

继续阅读

Qt中 QString 和int， char等的“相互”转换

bzoj4652 [Noi2016]循环之美

Codeforces Round #691(A->C)(C数学)

linux网络编程学习之一网络字节序

Codeforces Round #742 (Div. 2) C. Carrying Conundrum

算法~如何将整数按着类型分段

Redis存储结构探究

关于H.264 profile-level-id

生成1-256十进制，二进制，八进制，十六进制值

萌新卷妹带你逃出算法无名岛第一站

数字频率计设计

AI算法给手画线稿自动上色?

hihocoder 1432 JiLi Number

集算器协助MongoDB计算之数位比较

Go类型转换-int\float\string之间相互转换

c++十六进制转十进制

float、double精度丢失

都知道十进制整数转换二进制( / 2)，十进制小数转换二进制( * 2 取 整)，但小数有时乘不尽。

结论：

（1）整数永远可以用二进制精确表示

（2）小数的二进制表示有时是不可能精确的

正如十进制不法表示1/3, 二进制也无法表示1/10；这也就解释了为什么浮点型减法出现了”减不尽”的精度丢失问题

而有时浮点数加减时小数点最后几位出现了意外数字，

这是因为浮点数所在内存的表示形式，符合IEEE754标准。

float内存存储结构

可检验:

手动练习一个。

继续阅读

　　都知道十进制整数转换二进制( / 2)，十进制小数转换二进制( * 2 取整)，但小数有时乘不尽。