sprintf()使用說明
在將各種類型的數據構造成字符串時,sprintf 的強大功能很少會讓你失望。由於sprintf 跟printf 在用法上幾乎一樣,只是打印的目的地不同而已,前者打印到字符串中,後者則直接在命令行上輸出。這也導致sprintf 比printf 有用得多。
sprintf 是個變參函數,定義如下:
int sprintf( char *buffer, const char *format [, argument] ... );
除了前兩個參數類型固定外,後面可以接任意多個參數。而它的精華,顯然就在第二個參數:
格式化字符串上。
printf 和sprintf 都使用格式化字符串來指定串的格式,在格式串內部使用一些以“%”開頭的格式說明符(format specifications)來占據一個位置,在後邊的變參列表中提供相應的變量,最終函數就會用相應位置的變量來替代那個說明符,產生一個調用者想要的字符串。
格式化數字字符串
sprintf 最常見的應用之一莫過於把整數打印到字符串中,所以,spritnf 在大多數場合可以替代
itoa。
如:
//把整數123 打印成一個字符串保存在s 中。
sprintf(s, "%d", 123); //產生"123"
可以指定寬度,不足的左邊補空格:
sprintf(s, "%8d%8d", 123, 4567); //產生:" 123 4567"
當然也可以左對齊:
sprintf(s, "%-8d%8d", 123, 4567); //產生:"123 4567"
也可以按照16 進制打印:
sprintf(s, "%8x", 4567); //小寫16 進制,寬度占8 個位置,右對齊
sprintf(s, "%-8X", 4568); //大寫16 進制,寬度占8 個位置,左對齊
這樣,一個整數的16 進制字符串就很容易得到,但我們在打印16 進制內容時,通常想要一種左邊補0 的等寬格式,那該怎麼做呢?很簡單,在表示寬度的數字前面加個0 就可以了。
sprintf(s, "%08X", 4567); //產生:"000011D7"
上面以”%d”進行的10 進制打印同樣也可以使用這種左邊補0 的方式。
這裡要注意一個符號擴展的問題:比如,假如我們想打印短整數(short)-1 的內存16 進制表示形式,在Win32 平台上,一個short 型占2 個字節,所以我們自然希望用4 個16 進制數字來打印它:
short si = -1;
sprintf(s, "%04X", si);
產生“FFFFFFFF”,怎麼回事?因為spritnf 是個變參函數,除了前面兩個參數之外,後面的參數都不是類型安全的,函數更沒有辦法僅僅通過一個“%X”就能得知當初函數調用前參數壓棧時被壓進來的到底是個4 字節的整數還是個2 字節的短整數,所以采取了統一4 字節的處理方式,導致參數壓棧時做了符號擴展,擴展成了32 位的整數-1,打印時4 個位置不夠了,就把32 位整數-1 的8 位16 進制都打印出來了。
如果你想看si 的本來面目,那麼就應該讓編譯器做0 擴展而不是符號擴展(擴展時二進制左邊補0 而不是補符號位):
sprintf(s, "%04X", (unsigned short)si);
就可以了。或者:
unsigned short si = -1;
sprintf(s, "%04X", si);
sprintf 和printf 還可以按8 進制打印整數字符串,使用”%o”。注意8 進制和16 進制都不會打
印出負數,都是無符號的,實際上也就是變量的內部編碼的直接的16 進制或8 進制表示。
控制浮點數打印格式
浮點數的打印和格式控制是sprintf 的又一大常用功能,浮點數使用格式符”%f”控制,默認保
留小數點後6 位數字,比如:
sprintf(s, "%f", 3.1415926); //產生"3.141593"
但有時我們希望自己控制打印的寬度和小數位數,這時就應該使用:”%m.nf”格式,其中m 表
示打印的寬度,n 表示小數點後的位數。比如:
sprintf(s, "%10.3f", 3.1415626); //產生:" 3.142"
sprintf(s, "%-10.3f", 3.1415626); //產生:"3.142 "
sprintf(s, "%.3f", 3.1415626); //不指定總寬度,產生:"3.142"
注意一個問題,你猜
int i = 100;
sprintf(s, "%.2f", i);
會打出什麼東東來?“100.00”?對嗎?自己試試就知道了,同時也試試下面這個:
sprintf(s, "%.2f", (double)i);
第一個打出來的肯定不是正確結果,原因跟前面提到的一樣,參數壓棧時調用者並不知道跟i相對應的格式控制符是個”%f”。而函數執行時函數本身則並不知道當年被壓入棧裡的是個整數,於是可憐的保存整數i 的那4 個字節就被不由分說地強行作為浮點數格式來解釋了,整個亂套了。不過,如果有人有興趣使用手工編碼一個浮點數,那麼倒可以使用這種方法來檢驗一下你手工編排的結果是否正確。
字符/Ascii 碼對照
我們知道,在C/C++語言中,char 也是一種普通的scalable 類型,除了字長之外,它與short,
int,long 這些類型沒有本質區別,只不過被大家習慣用來表示字符和字符串而已。(或許當年該把
這個類型叫做“byte”,然後現在就可以根據實際情況,使用byte 或short 來把char 通過typedef 定義出來,這樣更合適些)於是,使用”%d”或者”%x”打印一個字符,便能得出它的10 進制或16 進制的ASCII 碼;反過來,使用”%c”打印一個整數,便可以看到它所對應的ASCII 字符。以下程序段把所有可見字符的ASCII 碼對照表打印到屏幕上(這裡采用printf,注意”#”與”%X”合用時自動為16 進制數增加”0X”前綴):
for(int i = 32; i < 127; i++) {
printf("[ %c ]: %3d 0x%#04X/n", i, i, i);
}
連接字符串
sprintf 的格式控制串中既然可以插入各種東西,並最終把它們“連成一串”,自然也就能夠連
接字符串,從而在許多場合可以替代strcat,但sprintf 能夠一次連接多個字符串(自然也可以同時
在它們中間插入別的內容,總之非常靈活)。比如:
char* who = "I";
char* whom = "CSDN";
sprintf(s, "%s love %s.", who, whom); //產生:"I love CSDN. "
strcat 只能連接字符串(一段以’’結尾的字符數組或叫做字符緩沖,null-terminated-string),但有時我們有兩段字符緩沖區,他們並不是以’’結尾。比如許多從第三方庫函數中返回的字符數組,從硬件或者網絡傳輸中讀進來的字符流,它們未必每一段字符序列後面都有個相應的’’來結尾。如果直接連接,不管是sprintf 還是strcat 肯定會導致非法內存操作,而strncat 也至少要求第一個參數是個null-terminated-string,那該怎麼辦呢?我們自然會想起前面介紹打印整數和浮點數時可以指定寬度,字符串也一樣的。比如:
char a1[] = {'A', 'B', 'C', 'D', 'E', 'F', 'G'};
char a2[] = {'H', 'I', 'J', 'K', 'L', 'M', 'N'};
如果:
sprintf(s, "%s%s", a1, a2); //Don't do that!
十有八九要出問題了。是否可以改成:
sprintf(s, "%7s%7s", a1, a2);
也沒好到哪兒去,正確的應該是:
sprintf(s, "%.7s%.7s", a1, a2);//產生:"ABCDEFGHIJKLMN"
這可以類比打印浮點數的”%m.nf”,在”%m.ns”中,m 表示占用寬度(字符串長度不足時補空格,超出了則按照實際寬度打印),n 才表示從相應的字符串中最多取用的字符數。通常在打印字符串時m 沒什麼大用,還是點號後面的n 用的多。自然,也可以前後都只取部分字符:
sprintf(s, "%.6s%.5s", a1, a2);//產生:"ABCDEFHIJKL"
在許多時候,我們或許還希望這些格式控制符中用以指定長度信息的數字是動態的,而不是靜態指定的,因為許多時候,程序要到運行時才會清楚到底需要取字符數組中的幾個字符,這種動態的寬度/精度設置功能在sprintf 的實現中也被考慮到了,sprintf 采用”*”來占用一個本來需要一個指定寬度或精度的常數數字的位置,同樣,而實際的寬度或精度就可以和其它被打印的變量一樣被提供出來,於是,上面的例子可以變成:
sprintf(s, "%.*s%.*s", 7, a1, 7, a2);
或者:
sprintf(s, "%.*s%.*s", sizeof(a1), a1, sizeof(a2), a2);
實際上,前面介紹的打印字符、整數、浮點數等都可以動態指定那些常量值,比如:
sprintf(s, "%-*d", 4, 'A'); //產生"65 "
sprintf(s, "%#0*X", 8, 128); //產生"0X000080","#"產生0X
sprintf(s, "%*.*f", 10, 2, 3.1415926); //產生" 3.14"
打印地址信息
有時調試程序時,我們可能想查看某些變量或者成員的地址,由於地址或者指針也不過是個32 位的數,你完全可以使用打印無符號整數的”%u”把他們打印出來:
sprintf(s, "%u", &i);
不過通常人們還是喜歡使用16 進制而不是10 進制來顯示一個地址:
sprintf(s, "%08X", &i);
然而,這些都是間接的方法,對於地址打印,sprintf 提供了專門的”%p”:
sprintf(s, "%p", &i);
我覺得它實際上就相當於:
sprintf(s, "%0*x", 2 * sizeof(void *), &i);
利用sprintf 的返回值
較少有人注意printf/sprintf 函數的返回值,但有時它卻是有用的,spritnf 返回了本次函數調用
最終打印到字符緩沖區中的字符數目。也就是說每當一次sprinf 調用結束以後,你無須再調用一次
strlen 便已經知道了結果字符串的長度。如:
int len = sprintf(s, "%d", i);
對於正整數來說,len 便等於整數i 的10 進制位數。
下面的是個完整的例子,產生10 個[0, 100)之間的隨機數,並將他們打印到一個字符數組s 中,
以逗號分隔開。
#include
#include
#include
int main() {
srand(time(0));
char s[64];
int offset = 0;
for(int i = 0; i < 10; i++) {
offset += sprintf(s + offset, "%d,", rand() % 100);
}
s[offset - 1] = '/n';//將最後一個逗號換成換行符。
printf(s);
return 0;
}
設想當你從數據庫中取出一條記錄,然後希望把他們的各個字段按照某種規則連接成一個字
符串時,就可以使用這種方法,從理論上講,他應該比不斷的strcat 效率高,因為strcat 每次調用
都需要先找到最後的那個’’的位置,而在上面給出的例子中,我們每次都利用sprintf 返回值把這
個位置直接記下來了。
使用sprintf 的常見問題
sprintf 是個變參函數,使用時經常出問題,而且只要出問題通常就是能導致程序崩潰的內存訪
問錯誤,但好在由sprintf 誤用導致的問題雖然嚴重,卻很容易找出,無非就是那麼幾種情況,通
常用眼睛再把出錯的代碼多看幾眼就看出來了。
?? 緩沖區溢出
第一個參數的長度太短了,沒的說,給個大點的地方吧。當然也可能是後面的參數的問
題,建議變參對應一定要細心,而打印字符串時,盡量使用”%.ns”的形式指定最大字符數。
?? 忘記了第一個參數
低級得不能再低級問題,用printf 用得太慣了。//偶就常犯。:。(
?? 變參對應出問題
通常是忘記了提供對應某個格式符的變參,導致以後的參數統統錯位,檢查檢查吧。尤
其是對應”*”的那些參數,都提供了嗎?不要把一個整數對應一個”%s”,編譯器會覺得你
欺她太甚了(編譯器是obj 和exe 的媽媽,應該是個女的,:P)。
strftime
sprnitf 還有個不錯的表妹:strftime,專門用於格式化時間字符串的,用法跟她表哥很像,也
是一大堆格式控制符,只是畢竟小姑娘家心細,她還要調用者指定緩沖區的最大長度,可能是為
了在出現問題時可以推卸責任吧。這裡舉個例子:
time_t t = time(0);
//產生"YYYY-MM-DD hh:mm:ss"格式的字符串。
char s[32];
strftime(s, sizeof(s), "%Y-%m-%d %H:%M:%S", localtime(&t));
sprintf 在MFC 中也能找到他的知音:CString::Format,strftime 在MFC 中自然也有她的同道:
CTime::Format,這一對由於從面向對象哪裡得到了贊助,用以寫出的代碼更覺優雅。
sscanf()函數用法
定義函數int sscanf (const char *str,const char * format,........);
函數說明
sscanf()會將參數str的字符串根據參數format字符串來轉換並格式化數據。格式轉換形式請參考scanf()。轉換後的結果存於對應的參數內。
返回值 成功則返回參數數目,失敗則返回-1,錯誤原因存於errno中。 返回0表示失敗 否則,表示正確格式化數據的個數 例如:sscanf(str,"%d%d%s", &i,&i2, &s); 如果三個變成都讀入成功會返回3。 如果只讀入了第一個整數到i則會返回1。證明無法從str讀入第二個整數。
范例#include
main()
{
int i;
unsigned int j;
char input[ ]=”10 0x1b aaaaaaaa bbbbbbbb”;
char s[5];
sscanf(input,”%d %x %5[a-z] %*s %f”,&i,&j,s,s);
printf(“%d %d %s ”,i,j,s);
}
執行10 27 aaaaa
sscanf(stringBuf.c_str(), "%20[^#]#%20[^ ]",......)語句中""中的內容含義為:
“%[
]”符號用於聲明字符串,它比“%s”更具體,可以用於設置讀取的樣式。例如“%[a-z]”只讀取小寫字母,讀到其它字符就結束。注意,方括號中如果有“^”,代表一直讀到某字符為止。例如:
“%[^#]”:讀取字符串,一直到出現“#”號為止。
“%20[^#]”:讀取20個字節的字符串,出現“#”號時結束。
所以,“%20[^#]#%20[^ ]”的意義就是,
讀取兩個20字節大小的字符串,第一個字符串可以用#結束,第二個字符串可以用回車符結束。
它們的具體闡述,參見MSDN:“scanf Type Field Characters”章節,和“scanf Width
Specification”章節。
*********************************************************************************************************************************************
大家都知道sscanf是一個很好用的函數,利用它可以從字符串中取出整數、浮點數和字符串等等。它的使用方法簡單,特別對於整數和浮點數來說。但新手可能並不知道處理字符串時的一些高級用法,這裡做個簡要說明吧。
1. 常見用法。
以下是引用片段:
charstr[512]={0};
sscanf("123456","%s",str);
printf("str=%s
",str);
2. 取指定長度的字符串。如在下例中,取最大長度為4字節的字符串。
以下是引用片段:
sscanf("123456","%4s",str);
printf("str=%s
",str);
3. 取到指定字符為止的字符串。如在下例中,取遇到空格為止字符串。
以下是引用片段:
sscanf("123456abcdedf","%[^]",str);
printf("str=%s
",str);
4. 取僅包含指定字符集的字符串。如在下例中,取僅包含1到9和小寫字母的字符串。
以下是引用片段:
sscanf("123456abcdedfBCDEF","%[1-9a-z]",str);
printf("str=%s
",str);
5. 取到指定字符集為止的字符串。如在下例中,取遇到大寫字母為止的字符串。
以下是引用片段:
sscanf("123456abcdedfBCDEF","%[^A-Z]",str);
printf("str=%s",str);
*********************************************************************************************************************************************
名稱: sscanf() - 從一個字符串中讀進與指定格式相符的數據.
語法: int sscanf( string str, string fmt, mixed var1, mixed var2 ... );
整數sscanf( 字符串str, 字符串fmt, 混合var1, 混合var2 ... );
用法: 以指定的格式fmt 去解讀字符串str. fmt 中除了%d 和%s 以外, 亦可包含其他的字符串作為格式. 每一個%d 或%s 都對應一個參數, 按順序為var1, var2 ... %d 讀入一個整數到參數中, 而%s 讀入一個字符串. * 亦可用於格式中, (即%*d 和%*s) 加了星號(*) 表示跳過此數據不讀入. (也就是不把此數據讀入參數中) LPC 的sscanf() 與C 的sscanf() 雖然相似, 但仍有不同之處. LPC 的sscanf() 不需要(也不可) 提供變量的內存位址給sscanf(), 只需要給予變量的名字. 另一個不同點是, LPC 的sscanf() 對於: sscanf( str, "%s %s", str1, str2 ); 的語法, 將會把str 中的第一個英文單字(即第一個空白字符以前的內容) 讀入str1, 後面其余的內容讀入str2.
sscanf() 會返回符合格式的%d 和%s 總數.
以前曾經編寫過這樣的小程序:一個文本文件,每行是一條記錄,每條記錄中包含多個字段,每個字段之間以某種定界符分開,舉例如下:
Notebook,IBM,ThinkPad X32,6,12000
(各字段以逗號分隔,內容依次是:物品名稱,生產廠家,型號,數量,價格)
如果要對這樣的一行記錄進行處理,提取出各個字段,怎麼做比較好呢?
我以前的做法是在一個循環中用strtok函數每次取一個字段,然後將內容保存到一個字符串數組中。這樣做雖然可行,但我總感覺寫出的代碼有些啰嗦。
最近看到一段代碼,用C的標准庫函數sscanf,處理這樣的數據,只需一行就可以了。我把代碼整理了一下,去掉了無關的部分,核心部分如下:
float price;
int quantity;
char category[21], name[21];
char vendor[21], sku[21];
char buf[201];
fp = fopen(filename, "r");
fgets(buf, 200, fp);
sscanf(buf,
"%20[^#]#%20[^#]#%f#%i#%20[^#]#%20[^/n]",
name, sku, &price, &quantity, category, vendor);
下面簡單做些解說:
%20[^#]# 最多讀入20個字符,直到遇見定界符#,但不包含定界符
%f# 讀入一個浮點數,直到遇見定界符#
%i# 讀入一個整數,直到遇見定界符#
%20[^/n] 最多讀入20個字符,忽略行尾的回車符
是不是很簡潔明了呢?
#include <stdio.h>
int main()
{
char log[]="<14>2002-11-11 12:12:12 11.22.33.44 3 3 aaaa aaaaaa";
//char log[]="<1>2002-11-11 12:12:12 11.22.33.44 3 aaaa aaaaaa";
char test[]="<1111> 22";
char log2[200];
char str1[20];
char str2[20];
char str3[20];
char str4[20];
char str5[20];
char str6[20];
char str7[20];
int a1,a2,a3,a4,a5,a6;
sscanf(log,"<%d>%s %s %s %d %d %s",&a1,str2,str3,str4,&a5,&a6,str7);
printf("%d/n",a1);
printf("%s/n",str2);
printf("%s/n",str3);
printf("%s/n",str4);
printf("%d/n",a5);
printf("%d/n",a6);
printf("%s/n",str7);
sscanf(test,"<%d> %d",&a5,&a6);
printf("%d/n",a5);
printf("%d/n",a6);
sscanf(log,"<%[^>]>%[^ ] %[^ ] %[^ ] %[^ ] %[^ ] %[^$]",str1,str2,str3,str4,str5,str6,str7);
printf("%s/n",str1);
printf("%s/n",str2);
printf("%s/n",str3);
printf("%s/n",str4);
printf("%s/n",str5);
printf("%s/n",str6);
printf("%s/n",str7);
return 1;
}
const char *str = "drw-rw-rw- 1 user group 0 Oct 28 2003 -====流行音樂專用FTP=====-";
上面是源串,我要分別得到drw-rw-rw-,group,-====流行音樂專用FTP=====-字段
注意:因為這幾個字段的值會變化,所以我要用格式化輸入,分別存入下面的a b c中,高手幫忙!
下面這個是我沒成功的嘗試
char a[20];
char b[50];
char c[20];
int ret = sscanf(str, "%[^'' '']* %[''u''] %[^'' '']"
, a, b, c);
摘自:闫明--To Be a Linux Kernel Hacker