程式師世界 >> 編程語言 >> C語言 >> C >> 關於C >> C語言中結構體賦值問題的討論

C語言中結構體賦值問題的討論

編輯：關於C

在我印象中結構體好像是不能直接賦值的，正如數組不能直接賦值那樣，我懷疑這個地方有問題，但最後證明並不是這個問題。那麼就總結一下C語言中結構體賦值的問題吧：

結構體直接賦值的實現
下面是一個實例：

#include <stdio.h>

struct Foo {
    char a;
    int b;
    double c;
}foo1, foo2;          //define two structs with three different fields

void struct_assign(void)
{
foo2 = foo1; //structure directly assignment
}

int main()
{
    foo1.a = 'a';
    foo1.b = 1;
    foo1.c = 3.14;
    struct_assign();
    printf("%c %d %lf\n", foo2.a, foo2.b, foo2.c);

return 0;
}
我在Ubuntu 13.04下使用gcc 4.7.3 編譯運行得到的結果，如下所示：

guohl@guohailin:~/Documents/c$ gcc struct_test1.c -o struct_test1
guohl@guohailin:~/Documents/c$ ./struct_test1
a 1 3.140000
可以從結果上看出，結構體直接賦值在C語言下是可行的，我們看看struct_assign()函數的匯編實現，從而從底層看看C語言是如何實現兩個結構體之間的賦值操作的：

struct_assign:
    pushl   %ebp
    movl    %esp, %ebp
    movl    foo1, %eax
    movl    %eax, foo2      //copy the first 4 bytes from foo1 to foo2
    movl    foo1+4, %eax
    movl    %eax, foo2+4    //copy the second 4 bytes from foo1 to foo2
    movl    foo1+8, %eax
    movl    %eax, foo2+8    //copy the third 4 bytes from foo1 to foo2
    movl    foo1+12, %eax
    movl    %eax, foo2+12   //copy the forth 4 bytes from foo1 to foo2
    popl    %ebp
    ret
這段匯編比較簡單，由於結構體的對齊的特性，sizeof(srtruct Foo)=16,通過四次movl操作將foo1的結構體內容拷貝到結構體foo2中。從匯編上看出，結構體賦值，采用的類似於memcpy這種形式，而不是逐個字段的拷貝。

復雜結構體的賦值
如果結構體中含有其它復雜數據類型呢，例如數組、指針、結構體等，從上面的匯編實現可以看出，只要兩個結構體類型相同，就可以實現賦值，如下例：

#include <stdio.h>

struct Foo {
    int n;
    double d[2];
    char *p_c;
}foo1, foo2;

int main()
{
char *c = (char *) malloc (4*sizeof(char));
c[0] = 'a'; c[1] = 'b'; c[2] = 'c'; c[3] = '\0';

    foo1.n = 1;
    foo1.d[0] = 2; foo1.d[1] = 3;
    foo1.p_c = c;

foo2 = foo1; //assign foo1 to foo2

printf("%d %lf %lf %s\n", foo2.n, foo2.d[0], foo2.d[1], foo2.p_c);

return 0;
}
運行結果如下：

guohl@guohailin:~/Documents/c$ gcc struct_test2.c -o struct_test2
guohl@guohailin:~/Documents/c$ ./struct_test2
1 2.000000 3.000000 abc
可以看出結果和我們想象的是一樣的。再次驗證結構體的賦值，是直接結構體的內存的拷貝！但正是這個問題，如上面的實例，foo1 和 foo2 中p_c 指針都是指向我們申請的一塊大小為4個字節的內存區域，這裡注意的是，結構體的拷貝只是淺拷貝，即指針p_c的賦值並不會導致再申請一塊內存區域，讓foo2的p_c指向它。那麼，如果釋放掉foo1中的p_c指向的內存，此時foo2中p_c變成野指針，這是對foo2的p_c操作就會出現一些不可預見的問題！在C++中引入了一種可以允許用戶重載結構體賦值操作運算，那麼我們就可以根據語義重載賦值操作。

數組是二等公民
二等公民在維基百科上的解釋是：

二等公民不是一個正式的術語，用來描述一個社會體系內對一部分人的歧視或對外來人口的政治限制，即使他們作為一個公民或合法居民的地位。二等公民雖然不一定是奴隸或罪犯，但他們只享有有限的合法權利、公民權利和經濟機會，並經常受到虐待或忽視。法律無視二等公民，不向他們提供保護，甚至在制訂法律時可能會根本不考慮他們的利益。劃分出二等公民的行為，普遍被視為一種侵犯人權的行為。典型的二等公民所面臨的障礙包括但不僅限於（缺乏或喪失表決權）：權利被剝奪，限制民事或軍事服務（不包括任何情況下的征兵），以及限制，語言，宗教，教育，行動和結社的自由，武器的所有權，婚姻，性別認同和表達，住房和財產所有權。
從詞條上解釋可以看出二等公民與一等公民在權利上是有差別的，這個詞很有意思作為計算機專業術語，其含義也有異曲同工之妙！同樣我們看看維基百科對計算機的術語”first-class citizen"(一等公民）的定義，一般要滿足以下幾點，

•can be stored in variables and data structures
•can be passed as a parameter to a subroutine
•can be returned as the result of a subroutine
•can be constructed at run-time
•has intrinsic identity (independent of any given name)
對比著上面的定義來看C語言數組，數組作為一個函數的參數傳遞時，退化成一個指針; 同時，數組無法作為函數的返回值; 也許讓數組更不服氣的是，數組之間不能直接賦值操作，如下面的操作就是非法的：

int a[10];
int b[10];
a = b;
但是如果數組包裝在結構體中，那麼就能進行賦值了！相比之下，結構體可以作為函數參數和返回值，這就是一等公民的待遇！至於為什麼數組必須是二等公民，這是有歷史原因的，大家可以參考C 語言的發展史來看，有時間這塊內容我再補上！

--------------------------------------------------------------------------------