程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> C語言 >> 關於C語言 >> 不同優化選項對ARM下C語言編譯的影響

不同優化選項對ARM下C語言編譯的影響

編輯:關於C語言

      我們知道在C語言編譯時,有那麼幾個常用的優化編譯選項,分別是-O0,-O1,-O2,-O3以及-Os。之前一直覺得既然是優化選項,頂多是優化一下邏輯,提高一些效率或者減少一下程序大小而已。很少會覺得它們會影響程序的最終結果。直到最近在ARM平台上發現一個程序裡的一個bug,才覺得這些優化選項有時候也沒那麼智能。或者說針對ARM平台,還沒有那麼智能。
      首先看這麼一段程序,此程序是我將問題簡單化的程序:

#include<stdio.h><.h>

 buffer[] = {,,,,,,, iTest =  *p = ( *)(buffer + &iTest, , buffer[, buffer[ 

    乍看之下,覺得這個程序沒啥問題。然後我們將此程序文件名稱叫point.c。然後分別用交叉編譯鏈進行如下編譯:
    arm-xxx-linux-gcc point.c -o point0 -O0
    arm-xxx-linux-gcc point.c -o point1 -O1
    arm-xxx-linux-gcc point.c -o point2 -O2
    最終再分別執行三個程序,結果卻有點出人意料:
    ./point0
    6
    34
    ./point1
    34
    0
    ./point2
    6
    0
    只有在-O0,也就是沒有優化的情況下,結果才和假想的一致。但是同樣的問題在x86平台上卻沒有問題。
    於是我通過用以下命令,分別來生成不同優化選項下的匯編代碼,來確定在ARM平台上編譯到底出了什麼問題。
    arm-xxx-linux-gcc point.c -o point0.s -O0 -S
    arm-xxx-linux-gcc point.c -o point1.s -O1 -S
    arm-xxx-linux-gcc point.c -o point2.s -O2 -S
    然後對比三個匯編的代碼,發現問題出在memcpy這句話上。
    在point0.s中,程序是老老實實的調用的memcpy,然後就將0x12345678老老實實按照字節一個個的放到了buffer+7的位置。
    而在point1.s中程序則是沒有調用memcpy,而是用的語句:
    str        r3, [sp, #7]
    而此時r3中存儲的就是0x12345678;而由於我采用的ARM平台是32位的,此語句執行時,地址線應該不會發生變化,所以最終的結果是buffer+4到buffer+7的數據被覆蓋了,而不是buffer+7到buffer+10的數據被修改。
    而在point2.s中,貌似又針對流水線進行了優化,程序執行順序會有所變化,在對buffer部分位置賦初值的順序是在str  r3, [sp, #7]之後,所以buffer+6處的數據反而是正確的6。
    分析到這兒,也許有人會說寫個簡單的程序,都會因為編譯的優化選項不同導致結果不同,那這memcpy是不是就不敢用了?
    其實一般只要有較好的編程習慣的話,都不會遇到此類問題,比如下面的程序:

#include<stdio.h><.h>

 buffer[] = {,,,,,,, iTest =  *p = buffer + &iTest, , buffer[, buffer[ 

    這段程序其實只是簡單的改變了p的類型,就能保證在各種優化下,結果都一樣。可見好的編程習慣是有多麼的重要。

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved