帶驗證的閱讀器
XMLValidatingReader類實現了XmlReader類,它提供了支持多種類型的XML驗證:DTD,XML-DataReduced(XDR)架構,以及XSD,DTD和XSD都是W3C官方推薦的。而XDR是Microsoft早期用於處理XML構架的一種格式。
你可以用XmlVlidatingReader類去驗證XML文檔和XML片斷。XmlValidatingReader類工作在XML閱讀器上面---是一個典型的XMLTextReader類實例。XMLTextReade用於讀取文檔的節點,但是XmlVlidatingReader依據需要的驗證類型去驗證每一個XML塊。
XmlVlidatingReader類只實現了非常小的XML閱讀器必備的一個功能子集。該類總是工作在一個已存在的XML閱讀器上面,它監視方法和屬性。如果你深入該類的構造函數,你會發現它很明顯的依靠一個已存在的文本閱讀器。帶驗證的XML閱讀器不能直接的從一個文件或一個URL序列化。該類的構造函數列表如下:
public XmlValidatingReader(XmlReader);
public XmlValidatingReader(Stream, XmlNodeType, XmlParserContext);
public XmlValidatingReader(string, XmlNodeType, XmlParserContext);
帶驗證的XML閱讀器能分析任何的XML片斷,XML片斷通過一個string或者一個stream提供,也可以分析任何閱讀器提供的XML文檔。
XmlVlidatingReader類中有重大改變的方法非常少(相對其它reader類來說),另外對Read,它有Skip和ReadTypedValue方法。Skip方法跳過當前節點所有的子節點(你不能跳過不良格式的XML文本,它是相當有用的算法),Skip方法也驗證被跳過的內容。ReadTypedValue方法返回指定XML架構(XSD)類型對應的CLR類型。如果該方法找到了XSD類型對應的CLR類型,則返回CLR的類型名。如果找不到,則把該節點的值作為一個字符串值返回。
帶驗證的XML閱讀器正如其名,它是一個基於節點的閱讀器,它驗證當前節點的結構是否符合當前的schema。驗證是增量式的;它沒有方法返回表示文檔是否有效的布爾值。通常你都是用Read方法去讀輸入的XML文檔。實際上,你也可以用帶驗證的閱讀器去讀XML文檔。在每一步中,當前被訪問的節點的結構是否與指定的schema符合,如果不符合,拋出一個異常。圖四是一個控制台應用程序,它有一個要輸入文件名的命令行,最後輸出驗證結果。
Figure 4 Console App
using System;
using System.Xml;
using System.Xml.Schema;
class MyXmlValidApp
{
public MyXmlValidApp(String fileName)
{
try {
Validate(fileName);
}
catch (Exception e) {
Console.WriteLine("Error:\t{0}", e.Message);
Console.WriteLine("Exception raised: {0}",
e.GetType().ToString());
}
}
private void Validate(String fileName)
{
XmlTextReader xtr = new XmlTextReader(fileName);
XmlValidatingReader vreader = new XmlValidatingReader(xtr);
vreader.ValidationType = ValidationType.Auto;
vreader.ValidationEventHandler += new
ValidationEventHandler(this.ValidationEventHandle);
vreader.Read();
vreader.MoveToContent();
while (vreader.Read()) {}
xtr.Close();
vreader.Close();
}
public void ValidationEventHandle(Object sender,
ValidationEventArgs args)
{
Console.Write("Validation error: " + args.Message + "\r\n");
}
public static void Main(String[] args)
{
MyXmlValidApp o = new MyXmlValidApp(args[0]);
return;
}
}
ValidationType屬性設置驗證的類型,它可以是:DTD,XSD,XDR或者none。如果沒有指定驗證的類型(用ValidationType.Auto選項),閱讀器將自動的根據文檔用最適合的驗證類型。在驗證過程中出現任何錯誤,都會觸發ValidationEventHandler事件。如果未提供事件ValidationEventHandler事件處理程序,則拋出一個XML異常。定義ValidationEventHandler事件處理程序是用於捕捉任何在XML源文件中存在錯誤而引發XML異常的一種方法。要注意的是閱讀器的原理是檢查一個文檔是否是格式良好的,以及檢查文檔是否與架構吻合。如果帶驗證的閱讀器發現一個有嚴重的格式錯誤的XML文檔,只會觸發XmlException異常,它不會觸發其它的事件。
驗證發生在用戶用Read方法向前移動指針時,一旦節點被分析和讀取,它獲得傳送過來的處理驗證的內部的對象。驗證操作是基於節點類型及被要求的驗證類型。它確認節點所有的屬性和節點包含的子節點是否符合驗證條件。
驗證對象在內部調用兩個不同風格的對象:DTD分析器和架構生成器(schemabuilder)。DTD分析器處理當前節點的內容和不符合DTD的子樹。架構生成器根據XDR或者XSD架構對當前的節點構建一個SOM(schemaobjectmodel)。架構生成器類實際上是所有指定為XDR和XSD架構生成器的基類。為什麼呢,雖然XDR和XSD架構的許多相同的方法被加工處理過,但是它們在執行時的性能沒有區別。
如果節點有子節點,用另一個臨時的閱讀器收集子節點信息,因此節點的架構信息能被完全地驗證。你可以看圖五:
注意,盡管XmlValidatingReader類的構造函數可以接受一個XmlReader類作為其閱讀器,但是該閱讀器只能是XmlTextReader類的一個實例或者是它的一個派生類的實例。這意味著你不能用其它從XmlReader派生的類(例如一個自定義的XML閱讀器)。在XmlValidatingReader類的內部,它假設閱讀器是一個子XmlTextReader對象及把傳入的閱讀器顯式的轉換成XmlTextReader類。如果你用XmlNodeReader或者自定義的閱讀器器,程序在編譯時會出錯,運行時拋出一個異常。
節點閱讀器
XML閱讀器提供一種增量式的方法(一個一個節點的讀)來處理文檔的內容。到目前為止,我們假設源文件是一個基於硬盤的流或者是一個字符串流,然而,我們不能保證在實際中會提供一個源文件的XMLDOM對象給我們。在這種情況下,我們需要一個帶有特別的讀方法的特別的類。對這種情況,.netFramework提供了XmlNodeReader類。
就像XmlTextReader訪問指定XML流中所有節點一樣,XmlNodeReader類訪問XMLDOM子樹的所有節點。XMLDOM類(在.NETFramework中的XmlDocument類)支持基於Xpath的方法,例如SelectNodes方法和SelectSingleNode方法。這些方法的作用是把匹配的節點放在內存中。如果你需要處理子樹中的所有節點,節點閱讀器比用增量式方法處理節點的閱讀器具有更高的效率:
// xmldomNode is the XML DOM node
XmlNodeReader nodeReader = new XmlNodeReader(xmldomNode);
while (nodeReader.Read())
{
// Do something here
}
當你要在配置文件(例如Web.cofig文件)中引用自定義的數據時,先把這些數據填充到XMLDOM樹中,然後用XmlNodeReader類與XMLDOM類結合處理這些數據。這也是高效的。