tft每日頭條

 > 生活

 > 位置和位序c語言

位置和位序c語言

生活 更新时间:2024-10-01 10:14:07
1. 粉絲問題

自己編寫的一個協議相關代碼,位域的值解析和自己想象的有出入。

位置和位序c語言(C語言位域和字節序)1

問題

結構體的頭:

位置和位序c語言(C語言位域和字節序)2

解析代碼和測試結果:

位置和位序c語言(C語言位域和字節序)3

就是說通過函數hexdump()解析出的内存是十六進制是 81 83 20 3B ......

從數據幀解析出的

opcode=0x8

該粉絲不明白為什麼解析出的值是0x8。

這個問題其實就是位域的問題和字節序的問題。

測試代碼

廢話不多說,直接寫個測試代碼

#include<stdio.h> //簡化的結構體 structiphdr{ unsignedcharfin:1; unsignedcharrsv:3; unsignedcharopcode:4; unsignedcharmask:1; unsignedcharpayload:7; unsignedchara; unsignedcharb; }; main() { structiphdrt; unsignedchar*s; //清空内存,防止有亂碼 memset(&t,0,4); //用指針指向結構體變量t s=(unsignedchar*)&t; //通過數組訪問的方式修改内存的值,因為hexdump解析的值是0x8183, //所以0x81必為最低字節的内存的數據 s[0]=0x81; s[1]=0x83; //打印出位域成員的值 printf("fin:%d rsv:%d opcode:%d mask:%d paylod:%d \n", t.fin,t.rsv,t.opcode,t.mask,t.payload); }

執行結果:

fin:1,rsv:0,opcode:8,mask:1paylod:65

分析:如下圖所示,紫色部分是位域成員對應的内存中的實際空間布局,地址從左到右增加 第一個字節的0x81賦值後,各位域對應的二進制:

fin:1 rsv:0 opcode:1000 mask:1 paylod:1000001

位置和位序c語言(C語言位域和字節序)4

如上圖多少,内存的第1個字節是0x81,第2個字節是0x83;

第一個字節0x81的最低的bit[0]對應fin,bit[3:1]對應rsv,bit[7:4]對應opcode;第二個字節0x83的最低bit[0]對應mask,bit[7:1]對應payload。

所以結果顯而易見。

2、什麼是位域?

有些信息在存儲時,并不需要占用一個完整的字節, 而隻需占幾個或一個二進制位。

例如在存放一個開關量時,隻有0和1 兩種狀态, 用一位二進位即可。為了節省存儲空間,并使處理簡便,C語言又提供了一種數據結構,稱為“位域”或“位段”。

所謂“位域”是把一個字節中的二進位劃分為幾個不同的區域,并說明每個區域的位數。

每個域有一個域名,允許在程序中按域名進行操作。這樣就可以把幾個不同的對象用一個字節的二進制位域來表示。一、位域的定義和位域變量的說明位域定義與結構定義相仿,其形式為:

struct位域結構名 { 位域列表 };

其中位域列表的形式為:

類型說明符位域名:位域長度

如粉絲所舉的實例:

structiphdr{ unsignedcharfin:1; unsignedcharrsv:3; unsignedcharopcode:4; unsignedcharmask:1; unsignedcharpayload:7; unsignedchara; unsignedcharb; };

位域變量的說明與結構變量說明的方式相同。可采用先定義後說明,同時定義說明或者直接說明這三種方式。例如:

structbs { inta:8; intb:2; intc:6; }data;

說明data為bs變量,共占兩個字節。其中位域a占8位,位域b占2位,位域c占6位。對于位域的定義尚有以下幾點說明:

一個位域必須存儲在同一個字節中,不能跨兩個字節

如一個字節所剩空間不夠存放另一位域時,應從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如:

structbs { unsigneda:4 unsigned:0/空域/ unsignedb:4/從下一單元開始存放/ unsignedc:4 };

在這個位域定義中,a占第一字節的4位,後4位填0表示不使用,b從第二字節開始,占用4位,c占用4位。

位域可以無位域名,這時它隻用來作填充或調整位置。無名的位域是不能使用的。例如:

structk { inta:1 int:2/該2位不能使用/ intb:3 intc:2 };

從以上分析可以看出,位域在本質上就是一種結構類型, 不過其成員是按二進位分配的。

這是位域操作的表示方法,也就是說後面加上“:1”的意思是這個成員的大小占所定義類型的1 bit,“:2”占2 bit,依次類推。當然大小不能超過所定義類型包含的總bit數。

一個bytes(字節)是8個 bit(二進制位)。例如你的結構體中定義的類型是u_char,一個字節,共8個bit,最大就不能超過8。32位機下,short是2字節,共16bit,最大就不能超過16,int是4字節,共32bit,最大就不能超過32. 依次類推。

位域定義比較省空間。

例如你上面的結構,定義的變量類型是u_char,是一字節類型,即8bit。

fc_subtype占了4bit,fc_type占2bit,fc_protocol_version占2bit,共8bit,正好是一個字節。

其他八個成員,各占1bit,共8bit,正好也是一個字節。

因此你的結構的大小如果用sizeof(struct frame_control)計算,就是2bytes。

3. 如何測試當前是大端還是小端?

計算機硬件有兩種儲存數據的方式:大端字節序(big endian)和小端字節序(little endian)。大端字節序:高位字節在前,低位字節在後,這是人類讀寫數值的方法。小端字節序:低位字節在前,高位字節在後。

0x1234567的大端字節序和小端字節序的寫法如下圖。

位置和位序c語言(C語言位域和字節序)5

為什麼會有小端字節序?

答案是,計算機電路先處理低位字節,效率比較高,因為計算都是從低位開始的。所以,計算機的内部處理都是小端字節序。

但是,人類還是習慣讀寫大端字節序。所以,除了計算機的内部處理,其他的場合幾乎都是大端字節序,比如網絡傳輸和文件儲存。

計算機處理字節序的時候,不知道什麼是高位字節,什麼是低位字節。它隻知道按順序讀取字節,先讀第一個字節,再讀第二個字節。

如果是大端字節序,先讀到的就是高位字節,後讀到的就是低位字節。小端字節序正好相反。

理解這一點,才能理解計算機如何處理字節序。

處理器讀取外部數據的時候,必須知道數據的字節序,将其轉成正确的值。然後,就正常使用這個值,完全不用再考慮字節序。

即使是向外部設備寫入數據,也不用考慮字節序,正常寫入一個值即可。外部設備會自己處理字節序的問題。

實例

仍然用上面的例子,但是做如下修改

#include<stdio.h> structiphdr{ unsignedcharfin:1; unsignedcharrsv:3; unsignedcharopcode:4; unsignedcharmask:1; unsignedcharpayload:7; }; main() { structiphdrt; unsignedshort*s; memset(&t,0,2); s=(unsignedchar*)&t; //注意,直接賦值0x8183,因為該常量必然和主機字節序一緻, //小端:83給低字節, //大端:81給低字節 *s=0x8183; printf("fin:%d rsv:%d opcode:%d mask:%d paylod:%d \n", t.fin,t.rsv,t.opcode,t.mask,t.payload); }

執行結果:

fin:1rsv:1opcode:8mask:1paylod:64

由結果可知,收到的0x8183這個值與對應的的二進制關系:

fin:1 rsv:001 opcode:1000 mask:1 paylod:1000000

位置和位序c語言(C語言位域和字節序)6

如上圖多少,内存的第1個字節是0x83,第2個字節是0x81【和前面的例子不一樣了,因為我們是直接賦值0x8183,而該常數是小字節序,所以低字節是0x83】;

可見:

低字節83給了 fin rsv opcode

所以,這說明了一口君的ubuntu是小端字節序。

4. 拓展例子

繼續将結構體做如下修改,當位域成員大小加一起不夠一個整字節的時候,驗證各成員在内存中的布局。

#include<stdio.h> structiphdr{ unsignedcharfin:1; unsignedcharopcode:4; unsignedchara; unsignedcharb; }; main() { structiphdrt; unsignedchar*s; memset(&t,0,2); s=(unsignedshort*)&t; t.fin=1; t.opcode=0xf; printf("%x\n",s[0]); }

位置和位序c語言(C語言位域和字節序)7

fin:1 opcode:1111

内存中形式如下:

位置和位序c語言(C語言位域和字節序)8

如果修改fin的值為0:

t.fin=0;

執行結果如下:

位置和位序c語言(C語言位域和字節序)9

fin:0 opcode:1111

内存中形式如下:

位置和位序c語言(C語言位域和字節序)10

5. 總結

大家遇到類似問題的時候,一定要寫一些實例去驗證,對于初學者來說,建議多參考上述實例。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved