tft每日頭條

 > 科技

 > c語言中各類型所占空間大小

c語言中各類型所占空間大小

科技 更新时间:2024-05-11 17:34:52

有些數據在存儲時并不需要占用一個完整的字節,隻需要占用一個或幾個二進制位即可。比如開關隻有通電和斷電兩種狀态,用 0 和 1 表示足以,也就是用一個二進位。正是基于這種考慮,C語言又提供了一種叫做位域的數據結構。

c語言中各類型所占空間大小(CC編程筆記)1

在結構體定義時,我們可以指定某個成員變量所占用的二進制位數(Bit),這就是位域。

structtest{

unsigned m;

unsigned n:4;

unsignedchar ch:6;

}

:後面的數字用來限定成員變量占用的位數。成員 m 沒有限制,根據數據類型即可推算出它占用 4 個字節(Byte)的内存。成員 n、ch 被:後面的數字限制,不能再根據數據類型計算長度,它們分别占用 4、6 位(Bit)的内存。

n、ch 的取值範圍非常有限,數據稍微大些就會發生溢出。

c語言中各類型所占空間大小(CC編程筆記)2

運行結果:

0xad, 0xe, $

0xb8901c, 0xd, :

對于 n 和 ch,第一次輸出的數據是完整的,第二次輸出的數據是殘缺的。

第一次輸出時,n、ch 的值分别是 0xE、0x24('$' 對應的 ASCII 碼為 0x24),換算成二進制是 1110、10 0100,都沒有超出限定的位數,能夠正常輸出。

第二次輸出時,n、ch 的值變為 0x2d、0x7a('z' 對應的 ASCII 碼為 0x7a),換算成二進制分别是 10 1101、111 1010,都超出了限定的位數。超出部分被直接截去,剩下 1101、11 1010,換算成十六進制為 0xd、0x3a(0x3a 對應的字符是 :)。

C語言标準規定,位域的寬度不能超過它所依附的數據類型的長度。通俗地講,成員變量都是有類型的,這個類型限制了成員變量的最大長度,:後面的數字不能超過這個長度。

例如上面的test,n 的類型是 unsigned int,長度為 4 個字節,共計 32 位,那麼 n 後面的數字就不能超過 32;ch 的類型是 unsigned char,長度為 1 個字節,共計 8 位,那麼 ch 後面的數字就不能超過 8。

我們可以這樣認為,位域技術就是在成員變量所占用的内存中選出一部分位寬來存儲數據。

C語言标準還規定,隻有有限的幾種數據類型可以用于位域。在 ANSI C 中,這幾種數據類型是 int、signed int 和 unsigned int(int 默認就是 signed int);到了 C99,_Bool 也被支持了。

但編譯器在具體實現時都進行了擴展,額外支持了 char、signed char、unsigned char 以及 enum 類型,所以上面的代碼雖然不符合C語言标準,但它依然能夠被編譯器支持。

位域是如何存儲

C語言标準并沒有規定位域的具體存儲方式,不同的編譯器就有不同的方法來實現,但它們都盡量壓縮位域存儲空間。

位域的具體存儲規則如下:

1) 當相鄰成員的類型相同時,如果它們的位寬之和小于類型的 sizeof 大小,那麼後面的成員緊鄰前一個成員存儲,直到不能容納為止;如果它們的位寬之和大于類型的 sizeof 大小,那麼後面的成員将從新的存儲單元開始,其偏移量為類型大小的整數倍。

以下面的位域 test 為例:

c語言中各類型所占空間大小(CC編程筆記)3

運行結果:4

m、n、p 的類型都是 unsigned int,sizeof 的結果為 4 個字節(Byte),也即 32 個位(Bit)。m、n、p 的位寬之和為 6 12 4 = 22,小于 32,所以它們會挨着存儲,中間沒有縫隙。

如果将成員 m 的位寬改為 22,那麼輸出結果将會是 8,因為 22 12 = 34,大于 32,n 會從新的位置開始存儲,相對 m 的偏移量是 sizeof(unsigned int),也即 4 個字節。

如果再将成員 p 的位寬也改為 22,那麼輸出結果将會是 12,三個成員都不會挨着存儲。

2) 當相鄰成員的類型不同時,不同的編譯器有不同的實現方案,GCC 會壓縮存儲,而 VC/VS 不會。

請看下面的位域 test:

c語言中各類型所占空間大小(CC編程筆記)4

在 GCC 下的運行結果為 4,三個成員挨着存儲;在 VC/VS 下的運行結果為 12,三個成員按照各自的類型存儲(與不指定位寬時的存儲方式相同)。

3) 如果成員之間穿插着非位域成員,那麼不會進行壓縮。

eg:

structtest{

unsigned m:12;

unsigned ch;

unsigned p:4;

};

在各個編譯器下 sizeof 的結果都是 12。

通過上面的分析,我們發現位域成員往往不占用完整的字節,有時候也不處于字節的開頭位置,因此使用&獲取位域成員的地址是沒有意義的,C語言也禁止這樣做。地址是字節的編号,而不是位的編号。

無名位域

位域成員可以沒有名稱,隻給出數據類型和位寬,如下所示:

structtest{

int m:12;

int:20;//該位域成員不能使用

int n:4;

};

無名位域一般用來作填充或者調整成員位置。因為沒有名稱,無名位域不能使用。

上面的例子中,如果沒有位寬為 20 的無名成員,m、n 将會挨着存儲,sizeof(struct bs) 的結果為 4;有了這 20 位作為填充,m、n 将分開存儲,sizeof(struct bs) 的結果為 8。


自學C/C 編程難度很大,不妨和一些志同道合的小夥伴一起學習成長!

C語言C 編程學習交流圈子,私信【C/C 編程】

有一些源碼和資料分享,歡迎轉行也學習編程的夥伴,和大家一起交流成長會比自己琢磨更快哦!

c語言中各類型所占空間大小(CC編程筆記)5

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved