使用expat的原因很多,主要還是因為expat更靈活。習慣了TinyXML,一開始不太習慣expat,分析一下,其實很容易上手的。
1.回調函數
以下案例解析xml文件中的elment,attribute和text。expat使用回調方式返回xml數據,解析器解析到一個element及其內部屬性後,將調用事先設置好的函數,同樣,當element結束和text結束後,也會分別調用對應的函數。
2.如何處理數據之間的包含關系
典型的方式是定義三個函數分別處理elment開始(含屬性)、element結束和文本內容。回調函數的第一個參數是自定義的,通常用於存儲 XML文檔的上下文信息,用XML_SetUserData可以設置這個參數,下例中傳遞一個整數指針,以便在每次回調時能知道該元素是第幾層元素。
該參數也可以是一個棧對象的地址,開始一個元素時,將新元素對應的數據壓入堆棧,處理下一級元素時,新元素是棧頂元素在子元素,然後處理完了繼續把該元素壓入堆棧,繼續下一級新的子元素。當元素結束後,需要出棧,以便解析下個兄弟元素程時能取到父節點。
好啦,基本應用還是很簡單的,實際上Expat的API函數不多。
3.如何處理屬性
屬性通過ElementHandler回調函數傳入,這裡有一個char** atts就是屬性,這是一個字符指針數組,如果有N個屬性,數組大小就是2*N+1,最後一個素組元素為空指針,奇數指針對應屬性名稱,偶數指針對應屬性值(字符串格式)。可以在一個循環中處理多個屬性,當遇到空指針時,表示沒有更多屬性了。
好啦,先看sample吧:
#include <stdio.h>
#include "expat.h"
#pragma warning(disable:4996)
#define XML_FMT_INT_MOD "l"
static void XMLCALL startElement(void *userData, const char *name, const char **atts)
{
int i;
int *depthPtr = (int *)userData;
for (i = 0; i < *depthPtr; i++)
printf(" ");
printf(name);
*depthPtr += 1;
for(i=0;atts[i]!=0;i+=2)
{
printf(" %s=%s",atts[i],atts[i+1]);
}
printf("\n");
}
static void XMLCALL endElement(void *userData, const char *name)
{
int *depthPtr = (int *)userData;
*depthPtr -= 1;
}
int main(int argc, char *argv[])
{
char buf[BUFSIZ]; XML_Parser parser = XML_ParserCreate(NULL);
int done; int depth = 0;
XML_SetUserData(parser, &depth);
XML_SetElementHandler(parser, startElement, endElement);
FILE* pFile= argc<2 ?stdin : fopen(argv[1],"rb");
do
{ int len = (int)fread(buf, 1, sizeof(buf), pFile);
done = len < sizeof(buf);
if (XML_Parse(parser, buf, len, done) == XML_STATUS_ERROR)
{
fprintf(stderr,"%s at line %" XML_FMT_INT_MOD "u\n",
XML_ErrorString(XML_GetErrorCode(parser)),
XML_GetCurrentLineNumber(parser));
return 1;
}
}
while (!done);
XML_ParserFree(parser);
fclose(pFile);
return 0;
}
4.其他ElementHanlder
expat還可以設置CData,Comment的handler,另外一些函數本人還沒使用過,涉及到更多的xml標准的知識,如果需要,可以參考官方的手冊。
摘自 無聊中的博客