1. 粉絲問題
自己編寫的一個協(xié)議相關(guān)代碼,位域的值解析和自己想象的有出入。
問題
結(jié)構(gòu)體的頭:
解析代碼和測試結(jié)果:
就是說通過函數(shù)hexdump()解析出的內(nèi)存是十六進制是 81 83 20 3B 。..。..
從數(shù)據(jù)幀解析出的
opcode = 0x8
該粉絲不明白為什么解析出的值是0x8。
這個問題其實就是位域的問題和字節(jié)序的問題。
測試代碼
廢話不多說,直接寫個測試代碼
#include 《stdio.h》
//簡化的結(jié)構(gòu)體
struct iphdr {
unsigned char fin:1;
unsigned char rsv:3;
unsigned char opcode:4;
unsigned char mask:1;
unsigned char payload:7;
unsigned char a;
unsigned char b;
};
main()
{
struct iphdr t;
unsigned char *s;
//清空內(nèi)存,防止有亂碼
memset(&t,0,4);
//用指針指向結(jié)構(gòu)體變量t
s = (unsigned char*)&t;
//通過數(shù)組訪問的方式修改內(nèi)存的值,因為hexdump解析的值是0x81 83,
//所以0x81必為最低字節(jié)的內(nèi)存的數(shù)據(jù)
s[0] = 0x81;
s[1] = 0x83;
//打印出位域成員的值
printf(“fin:%d rsv:%d opcode:%d mask:%d paylod:%d
”,
t.fin,t.rsv,t.opcode,t.mask,t.payload);
}
執(zhí)行結(jié)果:
fin:1,rsv:0,opcode:8,mask:1 paylod:65
分析:如下圖所示,紫色部分是位域成員對應(yīng)的內(nèi)存中的實際空間布局,地址從左到右增加第一個字節(jié)的0x81賦值后,各位域?qū)?yīng)的二進制:
fin:1
rsv:0
opcode:1000
mask:1
paylod:1000001
如上圖多少,內(nèi)存的第1個字節(jié)是0x81,第2個字節(jié)是0x83;
第一個字節(jié)0x81的最低的bit[0]對應(yīng)fin,bit[3:1]對應(yīng)rsv,bit[7:4]對應(yīng)opcode;第二個字節(jié)0x83的最低bit[0]對應(yīng)mask,bit[7:1]對應(yīng)payload。
所以結(jié)果顯而易見。
2、什么是位域?
有些信息在存儲時,并不需要占用一個完整的字節(jié), 而只需占幾個或一個二進制位。
例如在存放一個開關(guān)量時,只有0和1 兩種狀態(tài), 用一位二進位即可。為了節(jié)省存儲空間,并使處理簡便,C語言又提供了一種數(shù)據(jù)結(jié)構(gòu),稱為“位域”或“位段”。
所謂“位域”是把一個字節(jié)中的二進位劃分為幾個不同的區(qū)域,并說明每個區(qū)域的位數(shù)。
每個域有一個域名,允許在程序中按域名進行操作。這樣就可以把幾個不同的對象用一個字節(jié)的二進制位域來表示。一、位域的定義和位域變量的說明位域定義與結(jié)構(gòu)定義相仿,其形式為:
struct 位域結(jié)構(gòu)名
{
位域列表
};
其中位域列表的形式為:
類型說明符 位域名:位域長度
如粉絲所舉的實例:
struct iphdr {
unsigned char fin:1;
unsigned char rsv:3;
unsigned char opcode:4;
unsigned char mask:1;
unsigned char payload:7;
unsigned char a;
unsigned char b;
};
位域變量的說明與結(jié)構(gòu)變量說明的方式相同。可采用先定義后說明,同時定義說明或者直接說明這三種方式。例如:
struct bs
{
int a:8;
int b:2;
int c:6;
}data;
說明data為bs變量,共占兩個字節(jié)。其中位域a占8位,位域b占2位,位域c占6位。對于位域的定義尚有以下幾點說明:
一個位域必須存儲在同一個字節(jié)中,不能跨兩個字節(jié)。
如一個字節(jié)所剩空間不夠存放另一位域時,應(yīng)從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如:
struct bs
{
unsigned a:4
unsigned :0 /空域/
unsigned b:4 /從下一單元開始存放/
unsigned c:4
};
在這個位域定義中,a占第一字節(jié)的4位,后4位填0表示不使用,b從第二字節(jié)開始,占用4位,c占用4位。
位域可以無位域名,這時它只用來作填充或調(diào)整位置。無名的位域是不能使用的。例如:
struct k
{
int a:1
int :2 /該2位不能使用/
int b:3
int c:2
};
從以上分析可以看出,位域在本質(zhì)上就是一種結(jié)構(gòu)類型, 不過其成員是按二進位分配的。
這是位域操作的表示方法,也就是說后面加上“:1”的意思是這個成員的大小占所定義類型的1 bit,“:2”占2 bit,依次類推。當然大小不能超過所定義類型包含的總bit數(shù)。
一個bytes(字節(jié))是8個 bit(二進制位)。例如你的結(jié)構(gòu)體中定義的類型是u_char,一個字節(jié),共8個bit,最大就不能超過8。32位機下,short是2字節(jié),共16bit,最大就不能超過16,int是4字節(jié),共32bit,最大就不能超過32.依次類推。
位域定義比較省空間。
例如你上面的結(jié)構(gòu),定義的變量類型是u_char,是一字節(jié)類型,即8bit。
fc_subtype占了4bit,fc_type占2bit,fc_protocol_version占2bit,共8bit,正好是一個字節(jié)。
其他八個成員,各占1bit,共8bit,正好也是一個字節(jié)。
因此你的結(jié)構(gòu)的大小如果用sizeof(struct frame_control)計算,就是2bytes。
3. 如何測試當前是大端還是小端?
計算機硬件有兩種儲存數(shù)據(jù)的方式:大端字節(jié)序(big endian)和小端字節(jié)序(little endian)。大端字節(jié)序:高位字節(jié)在前,低位字節(jié)在后,這是人類讀寫數(shù)值的方法。小端字節(jié)序:低位字節(jié)在前,高位字節(jié)在后。
0x1234567的大端字節(jié)序和小端字節(jié)序的寫法如下圖。
為什么會有小端字節(jié)序?
答案是,計算機電路先處理低位字節(jié),效率比較高,因為計算都是從低位開始的。所以,計算機的內(nèi)部處理都是小端字節(jié)序。
但是,人類還是習(xí)慣讀寫大端字節(jié)序。所以,除了計算機的內(nèi)部處理,其他的場合幾乎都是大端字節(jié)序,比如網(wǎng)絡(luò)傳輸和文件儲存。
計算機處理字節(jié)序的時候,不知道什么是高位字節(jié),什么是低位字節(jié)。它只知道按順序讀取字節(jié),先讀第一個字節(jié),再讀第二個字節(jié)。
如果是大端字節(jié)序,先讀到的就是高位字節(jié),后讀到的就是低位字節(jié)。小端字節(jié)序正好相反。
理解這一點,才能理解計算機如何處理字節(jié)序。
處理器讀取外部數(shù)據(jù)的時候,必須知道數(shù)據(jù)的字節(jié)序,將其轉(zhuǎn)成正確的值。然后,就正常使用這個值,完全不用再考慮字節(jié)序。
即使是向外部設(shè)備寫入數(shù)據(jù),也不用考慮字節(jié)序,正常寫入一個值即可。外部設(shè)備會自己處理字節(jié)序的問題。
實例
仍然用上面的例子,但是做如下修改
#include 《stdio.h》
struct iphdr {
unsigned char fin:1;
unsigned char rsv:3;
unsigned char opcode:4;
unsigned char mask:1;
unsigned char payload:7;
};
main()
{
struct iphdr t;
unsigned short *s;
memset(&t,0,2);
s = (unsigned char *)&t;
//注意,直接賦值0x8183,因為該常量必然和主機字節(jié)序一致,
//小端:83給低字節(jié),
//大端:81給低字節(jié)
*s = 0x8183;
printf(“fin:%d rsv:%d opcode:%d mask:%d paylod:%d
”,
t.fin,t.rsv,t.opcode,t.mask,t.payload);
}
執(zhí)行結(jié)果:
fin:1 rsv:1 opcode:8 mask:1 paylod:64
由結(jié)果可知,收到的0x8183這個值與對應(yīng)的的二進制關(guān)系:
fin:1
rsv:001
opcode:1000
mask:1
paylod:1000000
如上圖多少,內(nèi)存的第1個字節(jié)是0x83,第2個字節(jié)是0x81【和前面的例子不一樣了,因為我們是直接賦值0x8183,而該常數(shù)是小字節(jié)序,所以低字節(jié)是0x83】;
可見:
低字節(jié)83給了 fin+rsv+opcode
所以,這說明了一口君的ubuntu是小端字節(jié)序。
4. 拓展例子
繼續(xù)將結(jié)構(gòu)體做如下修改,當位域成員大小加一起不夠一個整字節(jié)的時候,驗證各成員在內(nèi)存中的布局。
#include 《stdio.h》
struct iphdr {
unsigned char fin:1;
unsigned char opcode:4;
unsigned char a;
unsigned char b;
};
main()
{
struct iphdr t;
unsigned char *s;
memset(&t,0,2);
s = (unsigned short *)&t;
t.fin = 1;
t.opcode = 0xf;
printf(“%x
”,s[0]);
}
fin:1
opcode:1111
內(nèi)存中形式如下:
如果修改fin的值為0:
t.fin = 0;
執(zhí)行結(jié)果如下:
fin:0
opcode:1111
內(nèi)存中形式如下:
5. 總結(jié)
大家遇到類似問題的時候,一定要寫一些實例去驗證,對于初學(xué)者來說,建議多參考上述實例。
原文標題:【問答21】C語言:位域和字節(jié)序
文章出處:【微信公眾號:FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責任編輯:haq
-
C語言
+關(guān)注
關(guān)注
180文章
7605瀏覽量
137001 -
代碼
+關(guān)注
關(guān)注
30文章
4791瀏覽量
68694
原文標題:【問答21】C語言:位域和字節(jié)序
文章出處:【微信號:zhuyandz,微信公眾號:FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論