<input id="ohw05"></input>
  • <table id="ohw05"><menu id="ohw05"></menu></table>
  • <var id="ohw05"></var>
  • <code id="ohw05"><cite id="ohw05"></cite></code>
    <label id="ohw05"></label>
    <var id="ohw05"></var>
  • 談談C++中的數據對齊

    對于C/C++程序員來說,掌握數據對齊是很有必要的,因為只有了解了這個概念,才能知道編譯器在什么時候會偷偷的塞入一些字節(padding)到我們的結構體(struct/class),也唯有這樣我們才能更好的理解、優化結構體和內存。
     

    幾個栗子

    看看幾個簡單的Struct,能猜出他們的SIZE嗎?(運行于64Bit win10 vs2017)

    struct A
    {
    	char c1;
    };
    
    struct B
    {
    	int i1;
    };
    
    struct C
    {
    	char c1;
    	int i1;
    };
    
    struct D
    {
    	char c1;
    	int i1;
    	char c2;
    };
    
    struct E
    {
    	char c1;
    	char c2;
    	int i1;
    };
    
    int main()
    {
    	std::cout << "A's size is " << sizeof(A) << std::endl;
    	std::cout << "B's size is " << sizeof(B) << std::endl;
    	std::cout << "C's size is " << sizeof(C) << std::endl;
    	std::cout << "D's size is " << sizeof(D) << std::endl;
    	std::cout << "E's size is " << sizeof(E) << std::endl;	
    }
    

    先揭曉答案

    如果對任何一個結構體的大小有疑問,那么這篇文章非常適合你,請接著往下看,我們會解釋數據對齊。

     

    數據對齊

    處理器讀取數據的行為

    在C/C++中,每種數據類型都有對齊的要求(這個更多是處理器的要求而非語言層面),大家都知道,處理器工作的時候需要數據總線(data bus)、控制總線(control bus)和地址總線(address bus)一起配合工作。而在數據總線取數據的時候,處理器為了高效的工作,一次會取4byte或者8byte數據(依系統32bit或者64bit而不同),這就是所謂數據字長(word size)。同時在讀取內存的時候,也會從4byte或者8byte邊界開始讀取,這是處理器行為,我們只能尊重不能改變。考慮下面的例子,

    struct F
    {
       int i1
       char c1;
       int i2;
       char c2;
    };
    #include <iostream>
    
    int main()
    {
       F f;
       printf("0x%p\n", &f);
    }
    

    它的起始地址輸出是:
    0x000000FE8BCFFB88

    所以在內存中可能的排列就是:

    讀取數據的時候,每次讀入8btye,8個字節為一個讀取單元,就像蒸籠的一格,這樣做的好處是每次可以盡可能多的讀入數據,減少讀取次數。設想,如果一次只讀入一個字節數據,那么一個Int就需要4次讀取,明顯效率就很低。
     

    編譯器的做法

    如果沒有對齊

    了解了處理器如何讀取數據的,我們就不難理解編譯器為什么會做出調整。試想,如果編譯器不在后臺做出填充(padding),那么我們就會遇到這種情況

    像這樣的話,訪問i1, c1 都不會有問題,但是訪問i2就會發現,數據散落在不同的蒸籠,原本只需要一次讀取就行的數據,還需要一次額外的數據讀取才行,這就造成了讀取數據的低效,在某些嚴格的CPU,比如ARM上面,這種非對齊的數據讀操作甚至會被拒絕。

    編譯器對齊

    所以,為了讓數據讀取效率最大化,編譯器會選擇犧牲一部分空間來換取效率,他們不會允許i2橫跨兩個讀取單元。在實際中,上面的結構體會是這樣的

    可以看出,

    • 為了解決i2的對齊問題,c1之后填充了3個空字節
    • 同時為了保持整個結構體的對齊(結構體對齊字節數等于其最大的數據成員的對齊字節數,這里是4),在結構體的尾部還會有3個空字節
    • 整個結構體的大小就是16字節,有6個字節是空字節。

    所以,在編譯器的作用下,最開始幾個Struct實際上擴展為,

    struct A
    {
    	char c1; //no padding
    };
    
    struct B
    {
    	int i1; //no padding
    };
    
    struct C
    {
    	char c1;
    	char pad[3]; //padding
    	int i1;
    };
    
    struct D
    {
    	char c1;
    	char pad1[3]; //padding
    	int i1;
    	char c2;
    	char pad2[3]; //padding
    };
    
    struct E
    {
    	char c1;
    	char c2;
    	char pad[2]; //padding
    	int i1;
    };
    

    對齊的目的是要讓數據訪問更高效,一般來說,數據類型的對齊要求和它的長度是一致的,比如,

    • char 是 1
    • short 是 2
    • int 是 4
    • double 是 8

    這不是巧合,比如short,2對齊保證了short只可能出現在一個讀取單元的0, 2, 4, 6格,而不會出現在1, 3, 5, 7格;再比如int,4對齊保證了一個讀取單元可以裝載2個int——在0或者4格。從根本上杜絕了同一個數據橫跨讀取單元的問題。
     

    總結

    可能有人會疑惑了,知道這些對我們工作有什么幫助嗎?如果僅僅是比較High-Level的應用程序編程,可能確實感覺不明顯,最多就當成一個知識點了解一下,但是對于搞比較底層開發的,比如游戲引擎,或者是在內存環境很緊張的情況下開發,比如嵌入式開發,那了解這個有助于在某些情況下節約內存。
    考慮前面的D和E結構體,他們擁有完全一樣的成員,卻有著不同的結構體大小,就是因為E選擇把對齊要求接近的變量類型放在一起,減小了填充padding的數量從而達到了減小結構體大小的目的。
    在設計結構體的時候,這個可以作為一個考量,有一些函數可以幫助我們查看某個類型的對齊要求,比如Visual Studio中的__alignof函數。
    這就是關于數據對齊的一些基礎知識,希望能幫助大家解惑,如果您發現本文有任何寫的不對的地方,歡迎留言指出來;如果有其他問題,也歡迎留言一起討論。

    posted on 2021-03-14 21:29  老胡寫代碼  閱讀(720)  評論(0編輯  收藏  舉報

    導航

    国产美女a做受大片观看