“定點數”就是“點”不動的數,即“小數點”不變的數。整數的小數點表示在最後一位數字的後面,而小數的小數點标識在真值的符号位後面。如圖所示:
對于定點數而言,由于其小數點位置不變,因此當處理非純小數(整數部分是零的小數是純小數)的時候,需要乘上一個比例因子,以防止溢出。那麼要是小數點可以移動那就好辦了,這種數我們稱為浮點數。
浮點運算就是實數運算,主要運用在科學和多媒體中,可以理解為小數點可移動的運算方式。
2.1 單精度浮點運算單精度浮點數也就是float,用4個字節來存儲的,單精度小數點後面共能精确到7位小數。單精度浮點運算應用在圖形應用程序graphics application,圖像處理image processing,機器學習。大部分人工智能訓練任務以單精度浮點數或半精度浮點數為主,推理以Int8為主。
2.2 雙精度浮點運算雙精度double是用8個字節來存儲的,雙精度可精确到15位小數。雙精度浮點運算主要用于超算領域。
實際應用中,單精度和雙精度浮點運算是綜合使用的,超算會根據需要分配單雙精度,模拟(化學、物理、金融),數值分析等科學計算。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!