如題,把C程序中的主函數int main(void)改成static int main(void)會怎麼樣呢? 比如把 復制代碼 #include <stdio.h> int main(void) { printf("Hi\n"); return 0; } 復制代碼 修改為: 復制代碼 #include <stdio.h> static int main(void) { printf("Hi\n"); return 0; } 復制代碼 請讀者先自己想一想! ————————————————————分割線——————————————————— 這個問題是我在看static關鍵字的時候提出來的。 只要你了解static關鍵字會使標示符具有內部鏈接(Internel Linkage)屬性,並且了解過C程序的編譯鏈接流程,應該可以得出答案—— 把C程序中的主函數int main(void)改成static int main(void)會導致鏈接失敗。 可以驗證一下: [zhanghaiba@Fedora code]$ gcc static_int_main.c /usr/lib/gcc/i686-redhat-linux/4.4.5/../../../crt1.o: In function `_start': (.text+0x18): undefined reference to `main' collect2: ld returned 1 exit status 如果換成gcc -c呢? [zhanghaiba@Fedora code]$ gcc -c static_int_main.c [zhanghaiba@Fedora code]$ 可見換成gcc -c可以編譯成功,因為gcc -c只有預處理、編譯和匯編階段,沒有鏈接階段。 首先,我們要了解一下Linux下GCC環境中C程序的編譯鏈接流程—— 編譯C程序,一般包括了C預處理階段、C到匯編的編譯階段、匯編到目標文件的編譯階段、目標文件的鏈接階段。 GCC支持下面幾個命令,使我們可以觀察到這些階段: 1)gcc -v GCC.c 編譯時打印出總的編譯流程,可以看到使用了哪些編譯工具。v是verbose(冗長)的意思,即盡可能多的打印信息。 2) gcc -E GCC.c 把源文件用預處理器處理,可重定向輸出到GCC.i文件再查看 3)gcc -S GCC.c 把源文件用預處理器和編譯器處理,自動輸出同名的GCC.s文件 4)gcc -c GCC.c 把源文件用預處理器、編譯器和匯編器處理,自動輸出同名.o文件 5)gcc GCC.c 把源文件用預處理器、編譯器、匯編器處理後,最後使用鏈接器生成缺省名為a.out的可執行文件 為什麼默認叫a.out?因為早期編譯並沒有鏈接器的概念,a.out是匯編器直接生成的,a意為assembly。但需要澄清的是在現代編譯器中a.out都是由鏈接器生成。 另外,使用選項-save-temps可以保留中間生成的文件,示范如下: [zhanghaiba@Fedora code]$ ls | grep hi hi.c hi.i hi.o hi.s 我們再用gcc -v來觀察總的編譯流程 復制代碼 [zhanghaiba@Fedora code]$ gcc -v hi.c Using built-in specs. Target: i686-redhat-linux Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=http://bugzilla.redhat.com/bugzilla --enable-bootstrap --enable-shared --enable-threads=posix --enable-checking=release --with-system-zlib --enable-__cxa_atexit --disable-libunwind-exceptions --enable-gnu-unique-object --enable-languages=c,c++,objc,obj-c++,java,fortran,ada --enable-java-awt=gtk --disable-dssi --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-1.5.0.0/jre --enable-libgcj-multifile --enable-java-maintainer-mode --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --disable-libjava-multilib --with-ppl --with-cloog --with-tune=generic --with-arch=i686 --build=i686-redhat-linux Thread model: posix gcc version 4.4.5 20101112 (Red Hat 4.4.5-2) (GCC) COLLECT_GCC_OPTIONS='-v' '-mtune=generic' '-march=i686' /usr/libexec/gcc/i686-redhat-linux/4.4.5/cc1 -quiet -v hi.c -quiet -dumpbase hi.c -mtune=generic -march=i686 -auxbase hi -version -o /tmp/ccrwAICf.s ignoring nonexistent directory "/usr/lib/gcc/i686-redhat-linux/4.4.5/include-fixed" ignoring nonexistent directory "/usr/lib/gcc/i686-redhat-linux/4.4.5/../../../../i686-redhat-linux/include" #include "..." search starts here: #include <...> search starts here: /usr/local/include /usr/lib/gcc/i686-redhat-linux/4.4.5/include /usr/include End of search list. GNU C (GCC) version 4.4.5 20101112 (Red Hat 4.4.5-2) (i686-redhat-linux) compiled by GNU C version 4.4.5 20101112 (Red Hat 4.4.5-2), GMP version 4.3.1, MPFR version 2.4.2. GGC heuristics: --param ggc-min-expand=81 --param ggc-min-heapsize=95788 Compiler executable checksum: e892644090a9a7e8c330a388c51818dd COLLECT_GCC_OPTIONS='-v' '-mtune=generic' '-march=i686' as -V -Qy -o /tmp/cc1w7Hxi.o /tmp/ccrwAICf.s GNU assembler version 2.20.51.0.2 (i686-redhat-linux) using BFD version version 2.20.51.0.2-15.fc13 20091009 COMPILER_PATH=/usr/libexec/gcc/i686-redhat-linux/4.4.5/:/usr/libexec/gcc/i686-redhat-linux/4.4.5/:/usr/libexec/gcc/i686-redhat-linux/:/usr/lib/gcc/i686-redhat-linux/4.4.5/:/usr/lib/gcc/i686-redhat-linux/:/usr/libexec/gcc/i686-redhat-linux/4.4.5/:/usr/libexec/gcc/i686-redhat-linux/:/usr/lib/gcc/i686-redhat-linux/4.4.5/:/usr/lib/gcc/i686-redhat-linux/ LIBRARY_PATH=/usr/lib/gcc/i686-redhat-linux/4.4.5/:/usr/lib/gcc/i686-redhat-linux/4.4.5/:/usr/lib/gcc/i686-redhat-linux/4.4.5/../../../:/lib/:/usr/lib/ COLLECT_GCC_OPTIONS='-v' '-mtune=generic' '-march=i686' /usr/libexec/gcc/i686-redhat-linux/4.4.5/collect2 --no-add-needed --eh-frame-hdr --build-id -m elf_i386 --hash-style=gnu -dynamic-linker /lib/ld-linux.so.2 /usr/lib/gcc/i686-redhat-linux/4.4.5/../../../crt1.o /usr/lib/gcc/i686-redhat-linux/4.4.5/../../../crti.o /usr/lib/gcc/i686-redhat-linux/4.4.5/crtbegin.o -L/usr/lib/gcc/i686-redhat-linux/4.4.5 -L/usr/lib/gcc/i686-redhat-linux/4.4.5 -L/usr/lib/gcc/i686-redhat-linux/4.4.5/../../.. /tmp/cc1w7Hxi.o -lgcc --as-needed -lgcc_s --no-as-needed -lc -lgcc --as-needed -lgcc_s --no-as-needed /usr/lib/gcc/i686-redhat-linux/4.4.5/crtend.o /usr/lib/gcc/i686-redhat-linux/4.4.5/../../../crtn.o 復制代碼 注意紅色加粗部分(由綠色文件生成紅色文件)—— (1)cc1是GCC編譯環境中的C編譯器,把C代碼編譯為匯編代碼,輸出為.s文件 (2)as是匯編器,把匯編代碼編譯為目標文件,輸出為.o文件 (3)collect2是GCC後期版本使用的鏈接器(環境),其實是先調用GNU的鏈接器ld對目標文件進行鏈接,最後收集與程序初始化相關的信息,構造程序的初始化結構。 ld是真正的鏈接器,對上一步的.o目標文件和其它需要.o文件或靜態鏈接庫.a文件、動態鏈接庫.so文件(如解壓C標准庫libc.a中取出需要的printf.o文件),一起鏈接輸出為a.out文件。 GCC後期版本使用了collect2來作為鏈接器,其實是間接調用ld鏈接器。 上面用到的工具中,as是GNU自帶的匯編器,ld是GNU自帶的鏈接器,它倆是GNU Binutils中最主要的二進制工具。 其中,ld-linux.so.2是動態鏈接器。最後注意-lc參數,l表示鏈接,c表示標准C庫,即libc.a或libc.so。 讓我們回到問題本身—— main不是C語言的關鍵字,但卻是約定俗成的主函數名字,不過它並不是程序執行的入口, C程序真正入口是_start全局符號(由匯編實現的函數),_start函數會調用庫函數__libc_start_main,然後__libc_start_main再調用main函數 我們知道main函數的聲明無非兩種形式,main函數的聲明(main符號)其實是在crt1.o目標文件中 通過nm工具可以查看crt1.o包括了哪些符號 復制代碼 [zhanghaiba@Fedora code]$ nm /usr/lib/crt1.o 00000000 R _IO_stdin_used 00000004 D __data_start U __libc_csu_fini U __libc_csu_init U __libc_start_main 00000044 R _fp_hw 00000020 T _start 00000004 W data_start U main 復制代碼 crt1.o中已經有了main符號,但卻是未定義(U)的,所以需要我們來實現main函數(即定義main符號),最後通過鏈接器來鏈接(這裡稱作符號解析) 如果把main函數定義為static,也就是具有內部鏈接(Internel Linkage)屬性,則編譯後的目標文件是局部符號(當前文件可見) 然而鏈接是不會對局部符號做符號解析的,只會根據目標文件的.rel.text段來指示鏈接全局的且未定義的符號(即修改可重定位目標文件REL的符號地址) 因此,鏈接時main符號找不到定義,這導致main符號找不到具體實現(定義),造成鏈接失敗 我們再看編譯失敗的反饋信息 /usr/lib/gcc/i686-redhat-linux/4.4.5/../../../crt1.o: In function `_start': (.text+0x18): undefined reference to `main' collect2: ld returned 1 exit status 就不難理解了—— 在函數_start中,引用了未定義的符號main collect2外殼:鏈接器ld返回1標記退出狀態(出錯狀態)