最近在用.NET做一個Java軟件的接口,其中開發過程中涉及不少對Xml文檔的操作,借助微軟的MSDN和自己的使用經驗,現簡單介紹一下ASP.NET中對XML文檔的操作。一、 XML文檔
我們大家都知道,XML是"Extensible Markup Language"的縮寫,即可擴展標記語言。它是Internet環境中跨平台的、依賴於內容的技術,是這個時代中處理分布式結構信息的選擇工具。在W3C組織領導下的工作小組發展並支持XML技術,使用它來簡化通過Internet的文檔信息傳輸。
XML文檔分為兩類:有效的XML文檔以及簡化格式的XML文檔。
一個簡化格式的XML文檔必須遵從下面幾個原則:
l 至少有一個元素
l 遵守XML規范
l 根元素(比如上面例子中的<Mail>)應該不被其他元素所包含
l 適當的元素嵌套是必須的
l 屬性值應該在問號內
l 除了保留實體外,所有的實體都要聲明
有效XML
有效XML文檔指的是那些擁有一個DTD參考文件的XML文檔。一個有效XML文檔至少必須首先是簡化格式的XML文檔。跟隨這個文檔的DTD文件的有效性促進了XML執行程序的運行以及文檔在兼容XML浏覽器中的顯示。
XML文檔舉例
例子1 - 一個簡化格式的XML文檔:
<?xml version="1.0" standalone="no"?>
<Mail>
<From>Author</From>
<To>Receiver</To>
<Date> Thu, 7 Oct 1999 11:15:16 -0600</Date>
<Subject>XML Introduction</Subject>
<body><p>Thanks for reading<Br/>
this article</p>
<br/>
<p>Hope you enjoyed this article</p>
</body>
</Mail>
第1行是XML聲明,其中version屬性指明了XML的版本,standalone屬性等於"no"表示標記聲明不獨立於文檔內部。XML聲明可以看做是"運行指令"。盡管這個聲明不是必須的,但是最好包含它,這將提高文檔的靈活性。
例子2 - 一個遵守mail.dtd文件的有效XML文檔。Date元素被省略,因為在mail.dtd中它是可選的。 元素 P 具有justify屬性。Body和P元素間是Comments文本:
<?xml version="1.0" standalone="no"?>
<!DOCTYPE Mail system "http://infowest.com/DTDS/mail.dtd">
<Mail>
<From>Author</From>
<To>Receiver</To>
<Cc>Receiver2</Cc>
<Subject>XML Introduction</Subject>
<body>Comments:<p align="justify">Thanks for reading<Br/>
this article</p>
<br/>
<p>Hope you enjoyed this article</p>
</body>
</Mail>
例子3 -一個遵守mail.dtd文件的有效XML文檔,存在Date 元素和Cc 元素,P元素擁有屬性right:
<?xml version="1.0" standalone="no"?>
<!DOCTYPE Mail system "http://infowest.com/DTDS/mail.dtd">
<Mail>
<From>Author</From>
<To>Receiver</To>
<Cc>Receiver2</Cc>
<Date> Thu, 7 Oct 1999 11:15:16 -0600</Date>
<Subject>XML Introduction</Subject>
<body>Comments:<p align = "right" >Thanks for reading<Br/>
this article</p>
<br/>
<p>Hope you enjoyed this article</p>
</body>
</Mail>
XML 文檔可以含有注釋信息,注釋的語法與HTML相似。除了"--"字符串外,任何文本信息都可以放置在標記<-- 和 -->之間。處理指令PI(Processing instruction)可以嵌入到文檔中, PI的數據成分可以被處理進程所識別。
創作者也許希望包含一些不被解析器解析的代碼。這些代碼可以放置到忽略代碼段中。可忽略的代碼段具備如下的語法:
<[CDATA[被忽略的文字信息]]>
簡言之,忽略代碼段要以<[CDATA[ and end with ]]> 開始。