為什么浮點(diǎn)精度運(yùn)算會有問題
我們平常使用的編程語言大多都有一個問題——浮點(diǎn)型精度運(yùn)算會不準(zhǔn)確。比如
double num = 0.1 + 0.1 + 0.1; // 輸出結(jié)果為 0.30000000000000004 double num2 = 0.65 - 0.6; // 輸出結(jié)果為 0.05000000000000004
筆者在測試的時候發(fā)現(xiàn) C/C++ 竟然不會出現(xiàn)這種問題,我最初以為是編譯器優(yōu)化,把這個問題解決了。但是 C/C++ 如果能解決其他語言為什么不跟進(jìn)?根據(jù)這個問題的產(chǎn)生原因來看,編譯器優(yōu)化解決這個問題邏輯不通。后來發(fā)現(xiàn)是打印的方法有問題,打印輸出方法會四舍五入。使用 printf("%0.17f\n", num); 以及 cout << setprecision(17) << num2 << endl; 多打印幾位小數(shù)即可看到精度運(yùn)算不準(zhǔn)確的問題。
那么精度運(yùn)算不準(zhǔn)確這是為什么呢?
我們接下來就需要從計算機(jī)所有數(shù)據(jù)的表現(xiàn)形式二進(jìn)制說起了。如果大家很了解二進(jìn)制與十進(jìn)制的相互轉(zhuǎn)換,那么就能輕易的知道精度運(yùn)算不準(zhǔn)確的問題原因是什么了。如果不知道就讓我們一起回顧一下十進(jìn)制與二進(jìn)制的相互轉(zhuǎn)換流程。
一般情況下二進(jìn)制轉(zhuǎn)為十進(jìn)制我們所使用的是按權(quán)相加法。十進(jìn)制轉(zhuǎn)二進(jìn)制是除2取余,逆序排列法。很熟的同學(xué)可以略過。
// 二進(jìn)制到十進(jìn)制 10010 = 0 * 2^0 + 1 * 2^1 + 0 * 2^2 + 0 * 2^3 + 1 * 2^4 = 18 // 十進(jìn)制到二進(jìn)制 18 / 2 = 9 .... 0 9 / 2 = 4 .... 1 4 / 2 = 2 .... 0 2 / 2 = 1 .... 0 1 / 2 = 0 .... 1 10010
那么,問題來了十進(jìn)制小數(shù)和二進(jìn)制小數(shù)是如何相互轉(zhuǎn)換的呢?
十進(jìn)制小數(shù)到二進(jìn)制小數(shù)一般是整數(shù)部分除 2 取余,逆序排列,小數(shù)部分使用乘 2 取整數(shù)位,順序排列。二進(jìn)制小數(shù)到十進(jìn)制小數(shù)還是使用按權(quán)相加法。
// 二進(jìn)制到十進(jìn)制 10.01 = 1 * 2^-2 + 0 * 2^-1 + 0 * 2^0 + 1 * 2^1 = 2.25 // 十進(jìn)制到二進(jìn)制 // 整數(shù)部分 2 / 2 = 1 .... 0 1 / 2 = 0 .... 1 // 小數(shù)部分 0.25 * 2 = 0.5 .... 0 0.5 * 2 = 1 .... 1 // 結(jié)果 10.01
轉(zhuǎn)小數(shù)我們也了解了,接下來我們回歸正題,為什么浮點(diǎn)運(yùn)算會有精度不準(zhǔn)確的問題。接下來我們看一個簡單的例子 2.1 這個十進(jìn)制數(shù)轉(zhuǎn)成二進(jìn)制是什么樣子的。
2.1 分成兩部分 // 整數(shù)部分 2 / 2 = 1 .... 0 1 / 2 = 0 .... 1 // 小數(shù)部分 0.1 * 2 = 0.2 .... 0 0.2 * 2 = 0.4 .... 0 0.4 * 2 = 0.8 .... 0 0.8 * 2 = 1.6 .... 1 0.6 * 2 = 1.2 .... 1 0.2 * 2 = 0.4 .... 0 0.4 * 2 = 0.8 .... 0 0.8 * 2 = 1.6 .... 1 0.6 * 2 = 1.2 .... 1 0.2 * 2 = 0.4 .... 0 0.4 * 2 = 0.8 .... 0 0.8 * 2 = 1.6 .... 1 0.6 * 2 = 1.2 .... 1 ............
落入無限循環(huán)結(jié)果為 10.0001100110011........ , 我們的計算機(jī)在存儲小數(shù)時肯定是有長度限制的,所以會進(jìn)行截取部分小數(shù)進(jìn)行存儲,從而導(dǎo)致計算機(jī)存儲的數(shù)值只能是個大概的值,而不是精確的值。
從這里看出來我們的計算機(jī)根本就無法使用二進(jìn)制來精確的表示 2.1 這個十進(jìn)制數(shù)字的值,連表示都無法精確表示出來,計算肯定是會出現(xiàn)問題的。
精度運(yùn)算丟失的解決辦法
現(xiàn)有有三種辦法
- 如果業(yè)務(wù)不是必須非常精確的要求可以采取四舍五入的方法來忽略這個問題。
- 轉(zhuǎn)成整型再進(jìn)行計算。
- 使用 BCD 碼存儲和運(yùn)算二進(jìn)制小數(shù)(感興趣的同學(xué)可自行搜索學(xué)習(xí))。
一般每種語言都用高精度運(yùn)算的解決方法(比一般運(yùn)算耗費(fèi)性能),比如 Python 的 decimal 模塊,Java 的 BigDecimal,但是一定要把小數(shù)轉(zhuǎn)成字符串傳入構(gòu)造,不然還是有坑,其他語言大家可以自行尋找一下。
# Python 示例 from decimal import Decimal num = Decimal('0.1') + Decimal('0.1') + Decimal('0.1') print(num)
// Java 示例 import java.math.BigDecimal; BigDecimal add = new BigDecimal("0.1").add(new BigDecimal("0.1")).add(new BigDecimal("0.1")); System.out.println(add);
拓展:詳解浮點(diǎn)型
上面既然提到了浮點(diǎn)型的存儲是有限制,那么我們看一下我們的計算機(jī)是如何存儲浮點(diǎn)型的,是不是真的正如我們上面提到的有小數(shù)長度的限制。
那我們就以 Float 的數(shù)據(jù)存儲結(jié)構(gòu)來說,根據(jù) IEEE 標(biāo)準(zhǔn)浮點(diǎn)型分為符號位,指數(shù)位和尾數(shù)位三部分(各部分大小詳情見下圖)。
IEEE 754 標(biāo)準(zhǔn)
一般情況下我們表示一個很大或很小的數(shù)通常使用科學(xué)記數(shù)法,例如:1000.00001 我們一般表示為 1.00000001 * 10^3,或者 0.0001001 一般表示為 1.001 * 10^-4。
符號位
0 是正數(shù),1 是負(fù)數(shù)
指數(shù)位
指數(shù)很有意思因為它需要表示正負(fù),所以人們創(chuàng)造了一個叫 EXCESS 的系統(tǒng)。這個系統(tǒng)是什么意思呢?它規(guī)定 最大值 / 2 - 1 表示指數(shù)為 0。我們使用單精度浮點(diǎn)型舉個例子,單精度浮點(diǎn)型指數(shù)位一共有八位,表示的十進(jìn)制數(shù)最大就是 255。那么 255 / 2 - 1 = 127,127 就代表指數(shù)為 0。如果指數(shù)位存儲的十進(jìn)制數(shù)據(jù)為 128 那么指數(shù)就是 128 - 127 = 1,如果存儲的為 126,那么指數(shù)就是 126 - 127 = -1。
尾數(shù)位
比如上述例子中 1.00000001 以及 1.001 就屬于尾數(shù),但是為什么叫尾數(shù)呢?因為在二進(jìn)制中比如 1.xx 這個小數(shù),小數(shù)點(diǎn)前面的 1 是永遠(yuǎn)存在的,存了也是浪費(fèi)空間不如多存一位小數(shù),所以尾數(shù)位只會存儲小數(shù)部分。也就是上述例子中的 00000001 以及 001 存儲這樣的數(shù)據(jù)。
IEEE 754 標(biāo)準(zhǔn)
通過上述程序我們得到的存儲 1.25 的 float 二進(jìn)制結(jié)構(gòu)的具體值為 00111111101000000000000000000000 ,我們拆分一下 0 為符號位他是個正值。01111111 為指數(shù)位,01000000000000000000000 是尾數(shù)。接下來我們驗證一下 01111111 轉(zhuǎn)為十進(jìn)制是 127,那么經(jīng)過計算指數(shù)為 0。尾數(shù)是 01000000000000000000000 加上默認(rèn)省略的 1 為 1.01(省略后面多余的 0),轉(zhuǎn)換為十進(jìn)制小數(shù)就是 1.25。
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持服務(wù)器之家。
原文鏈接:https://blog.csdn.net/marco__/article/details/102515668