文章摘要
本文通過內存底層原理,幫你透徹了解數(shù)據(jù)存儲進內存與從內存中讀取的區(qū)別以及不同數(shù)據(jù)類型下數(shù)據(jù)計算、賦值的變化情況
要透徹理解這些,必須知道隱式類型轉換以及機器大小端的概念,本文會對此做簡單介紹(這兩個概念對C語言數(shù)據(jù)的深度理解非常重要)
一、C語言的數(shù)據(jù)類型
數(shù)據(jù)類型基本分為:
1.整性
char //字符本質上是整型,只是char類型值截斷開辟一個字節(jié) unsigned char signed char short //2字節(jié) unsigned short [int] signed short [int] int //4字節(jié) unsigned int signed int long //4字節(jié) unsigned long [int] signed long [int]
2.浮點型
float double
3.構造類型
數(shù)組類型 結構體類型 struct 枚舉類型 enum 聯(lián)合類型 union
4.指針類型
int* pi; char* pc; float* pf; void* pv; ...
5.空類型
void
二、隱式類型轉換
1.什么是隱式類型轉換
在C語言中,隱式類型轉換是編譯器自發(fā)的行為,它往往是從小到大的轉換,在數(shù)據(jù)類型上表現(xiàn)是少字節(jié)數(shù)據(jù)類型,轉換成多字節(jié)數(shù)據(jù)類型,保證數(shù)據(jù)的完整性;(面向對象語言也有該概念,并且對于類也會有隱式類型轉換)一般來說,隱式類型轉換大體分為兩種:整性提升和類型轉換
2.整型提升
1.定義:C的整型算術運算總是至少以缺省整型類型的精度來進行的。為了獲得這個精度,表達式中的字符(char類型1字節(jié))和短整型(short int類型2字節(jié))操作數(shù)在使用之前被轉換為普通整型(int類型4字節(jié)),這種轉換稱為整型提升。
通俗來說:無論數(shù)據(jù)類型是否為 char 、short int 、…,其在讀取到CPU進行計算時,都會先通過整性提升到32位計算,而結算結果的讀取位數(shù)取決于讀取的數(shù)據(jù)類型,若為char類型,則截斷取8位(bit).
【這里注意:通常CPU在計算時,用的數(shù)據(jù)是源碼已翻譯后的補碼來計算】
2.整性提升是按照變量的數(shù)據(jù)類型(指自身類型,而不是數(shù)值類型)的符號位來提升
//eg1.負數(shù)的整性提升 char a = -1; //char類型默認為有符號類型 //其二進制源碼為:1 000 0001 // 補碼為:1 111 1111 //整性提升時,由于8bit的char類型數(shù)據(jù)中符號位為1; //故提升為32位后 11111111 11111111 11111111 11111111;(補碼) //eg2.正數(shù)的整性提升 char a = 1; //其二進制源碼為:0 000 0001 // 補碼=源碼為:0 000 0001 //整性提升時,由于8bit的char類型數(shù)據(jù)中符號位為0; //故提升為32位后 00000000 00000000 00000000 00000001;(補碼)
3.截斷的具體體現(xiàn):
//eg3. char c = -129; printf("%d",c);
結果為:127
原因是:-129源碼為:1000 0000 0000 0000 0000 0000 1000 0001
在內存中的補碼為:1111 1111 1111 1111 1111 11110111 1111
而字符變量c 只截斷8bit位即c變量保存的是:0111 1111(補碼)
輸出d%位整型,且符號位為0
整型提升為0000 0000 0000 0000 0000 0000 0111 1111(補碼)
轉為源碼即為127
【注意這里的截斷原則與機器大小端有關,且截斷是在內存上對補碼進行操作】
3.類型轉換
1.概念:操作符兩邊的操作數(shù)屬于不同的類型,那么除非其中一個操作數(shù)的轉換為另一個操作數(shù)的類型,否則操作就無法進行;而這種轉換就是類型轉換(編譯器自發(fā))
2.從下至上,自動轉換
long double double float unsigned long int long int unsigned int int
3.【注意】這種類型轉換只是建立在運算操作符之間,不然會出現(xiàn)不合理問題
eg4. float f = 3.14; int num = f;//隱式轉換,會有精度丟失
賦值情況下導致在高位的float類型轉為低位的int類型,導致精度丟失
三、機器大小端
1.什么是大小端
小端(存儲)模式,是指數(shù)據(jù)的底位(低權值)保存在內存的底地址中,而數(shù)據(jù)的高位(高權值),保存在內存高地址中;
【大多數(shù)機器都采用小端模式】
大端(存儲)模式,是指數(shù)據(jù)的底位(低權值)保存在內存高的地址中,而數(shù)據(jù)的高位,保存在內存低地址中;
2.大小端在截斷的應用
上文的eg3.中出現(xiàn)了截斷,即字符c截斷整型數(shù)值-129
//eg3. char c = -129;
我們將代碼中的整型a變量在內存的地址儲存數(shù)據(jù)顯示出來,從內存地址可以看出,序列從高到低遞增
a:補碼為 1111 1111 1111 1111 1111 1111 0111 1111
轉為16進制后即為 ff ff ff 7f;(權值左邊最高,右邊最低)
再將字符變量c內存的地址儲存數(shù)據(jù)顯示出來,可以看出,由于char類型只有一字節(jié),會優(yōu)先從四字節(jié)a中截斷地址最低的一字節(jié)
由圖看出它截斷了低地址里的數(shù)據(jù)7f,而7f也是低權值。
故,在vs2013中,采用的是小端原則
3.判斷當前機器的字節(jié)序是大端還是小端
#include<stdio.h> #include<Windows.h> #pragma warning(disable:4996) int check_sys() { int i = 1; return (*(char*)&i);//注意,發(fā)生數(shù)據(jù)類型轉換 } int main() { int ret = check_sys(); if (ret) { printf("小端\n"); } else { printf("大端\n"); } system("pause"); return 0; }
【注意】(*(char*)&i);
這里是對指針的解引用時,從內存所取的字節(jié)大小由其指向的數(shù)據(jù)類型決定。 說白了就是 i 的地址從int *被強轉為char *,再解引用時,其指向的數(shù)據(jù)類型從int變?yōu)閏har,因此顯示的數(shù)據(jù)會發(fā)生截斷;
由上面的截斷方式我們可以知道,1在內存是以32位存儲的,按一字節(jié)來說,其高權值位為0、低權值位為1.故可以通過return傳參的1或0判斷大小端。
四、整型在內存中的存儲
1.原碼、反碼、補碼
一個數(shù)在計算機中的二進制表示形式, 叫做這個數(shù)的機器數(shù)。機器數(shù)是帶符號的,在計算機用一個數(shù)的最高位存放符號, 正數(shù)為0, 負數(shù)為1.
比如,十進制中的數(shù) +3 ,計算機字長為8位,轉換成二進制就是00000011;
如果是 -3 ,就是 10000011
在C語言中,整型在計算機的儲存情況是按原反補的規(guī)則儲存,即對于整型來說,數(shù)據(jù)存放在內存中其實是補碼。
計算機采用這種規(guī)則可以使數(shù)據(jù)運算時的+ - * / 運算都通過加法解決,這樣設計的計算機只需設計出加法模塊,大大節(jié)省成本。
具體規(guī)則如下:
1.正數(shù)
正數(shù)的原、反、補碼都相同,與原碼一樣
2.負數(shù)
原碼:該數(shù)的機器數(shù),最高位為符號位
反碼:原碼除符號位不變,其余位按位取反
補碼:反碼+1
2.舉例實踐整型數(shù)據(jù)在內存的存儲
//例1.嘗試判斷輸出結果是什么 int main() { char a = -1; signed char b = -1; unsigned char c = -1; printf("a=%d,b=%d,c=%d\n", a, b, c); system("pause"); return 0; }
結果:
例1解析:
-1在內存的補碼:1111 1111 1111 1111 1111 11111111 1111
char a 、signed char b 、unsigned char c 存放時發(fā)生截斷,其在內存的補碼均為:1111 1111
但是三位在以%d(整型)輸出時,會發(fā)生整型提升,由原來的8位整型提升到32位,而整型提升時高位補0還是補1需看數(shù)據(jù)自身類型(有符號類型補符號位,無符號類型直接補0)
char a 與 signed char b 均屬于有符號型,且符號位為1,補24位1
內存數(shù)值為:1111 1111 1111 1111 1111 1111 1111 1111;輸出%d時反向推回原碼,答案即為 -1
unsigned char c 屬于無符號型,補24位0
內存數(shù)值為:0000 0000 0000 0000 0000 0000 1111 1111;輸出%d時反向推回原碼,答案即為 255
//例2.嘗試判斷輸出結果是什么 int main() { char a = 128; char b = -128; printf("a=%u,b=%u\n", a,b); system("pause"); return 0; }
結果:
例2解析:
128在內存的補碼:0000 0000 0000 0000 0000 0000 1000 0000
-128的內存補碼: 1111 1111 1111 1111 1111 1111 1000 0000
char a 、char b 存放時發(fā)生截斷,其在內存的補碼均為:1000 0000
%u(無符號整型)輸出時,會發(fā)生整型提升,由原來的8位整型提升到32位
char a 與 char b 均屬于有符號型,且符號位為1,補24位1
內存數(shù)值均為:1111 1111 1111 1111 1111 1111 1000 0000;輸出%u時反碼直接當原碼,
答案即為 :
//例3.嘗試判斷輸出結果是什么 int main() { int i = -20; unsigned int j = 10; printf("i+j = %d\n", i + j); system("pause"); return 0; }
結果:
例3解析:
-20在內存的補碼:1111 1111 1111 1111 1111 1111 1110 1100
10在內存的補碼:0000 0000 0000 0000 0000 0000 0000 1010
int i 與 unsigned int j 都是四字節(jié)類型變量故存儲時不會發(fā)生截斷,
但 ?i + j =表達式會發(fā)生類型轉換,int 會自動轉換為 unsigned int 類型計算
CPU中將兩變量補碼進行相加得到:1111 1111 1111 1111 1111 1111 1111 0110
計算結果以%d(整型)輸出,反向推回原碼:1000 0000 0000 0000 0000 0000 0000 1010
答案即為 -10
//例4.嘗試判斷輸出結果是什么 int main() { unsigned int i; for (i = 9; i >= 0; i--) { printf("%u\n", i); } system("pause"); return 0; }
結果:
例4解析:
由于 i 變量時 unsinged int 類型,因此其無符號位,
且 ?i >= 0
表達式會發(fā)生類型轉換,int 0 會自動轉換為 unsigned int 類型計算
故其比較結果永遠為真,因為無符號類型第32bit位(符號位)永遠為0
for 循環(huán)條件永遠滿族,答案即為死循環(huán)
//例5.嘗試判斷輸出結果是什么 int main() { char a[1000]; int i; for (i = 0; i <1000; i++) { a[i] = -1 - i; } printf("%d\n", strlen(a)); system("pause"); return 0; }
結果:
例5解析:
char a[1000]數(shù)組的每一位元素都是1字節(jié)的char 類型,有字符位,故其保存的數(shù)值范圍:[-128,127];
-1-i 范圍從 -1到 -1000,但在循環(huán)體a[i] = -1 - i
中每次賦值都會發(fā)生截斷,由下圖可知,char類型保存的數(shù)值依次遞減時,-1 繼續(xù)減到 -128 ,128 減一位到 127,127 繼續(xù)減到0,0再減一位到 -1,繼續(xù)下一輪循環(huán);
而該題的輸出時數(shù)組字符長度,strlen遇 ‘\0'(等價于數(shù)值0),而在初始化后的char a[1000]數(shù)組中,數(shù)值第一次出現(xiàn)0在a[255];
故答案為255
//例6.嘗試判斷輸出結果是什么 int main() { unsigned char i = 0; for (i = 0; i <= 255; i++) { printf("%d ", i); Sleep(30); } system("pause"); return 0; }
結果:0-255無限循環(huán)
例6解析:
由例5解析的圖可知:unsigned char 類型的變量 i 的取值范圍:[-128,127],永遠小于255;
而%d輸出時,無符號類型直接整型提升補24位0:
0000 0000 (0)轉為 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000(補),補碼轉原碼:符號位為0,原碼與補碼一樣,值為0;
1000 0000(-128)轉為0000 0000 0000 0000 0000 0000 0000 0000 1000 0000(補),補碼轉原碼:1000 0000 0000 0000 0000 0000 1000 0000,值為128;
0111 1111(127)轉為0000 0000 0000 0000 0000 0000 0000 0111 1111(補),補碼轉原碼:符號位為0,原碼與補碼一樣,值為127
由此可知,無符號字符類型變量整型提升后再%d輸出沒有負數(shù)
故答案為:0-255循環(huán)
總結
本篇文章就到這里了,希望能夠給你帶來幫助,也希望您能夠多多關注服務器之家的更多內容!
原文鏈接:https://blog.csdn.net/Sober_harmonic/article/details/120475440