深刻XPath的詳解和Java示例代碼剖析。本站提示廣大學習愛好者:(深刻XPath的詳解和Java示例代碼剖析)文章只能為提供參考,不一定能成為您想要的結果。以下是深刻XPath的詳解和Java示例代碼剖析正文
import java.io.IOException;
import javax.xml.parsers.*;
import javax.xml.xpath.*;
import org.w3c.dom.*;
import org.xml.sax.SAXException;
public class XpathTest {
public static void main(String[] args) throws ParserConfigurationException,
SAXException, IOException, XPathExpressionException {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setNamespaceAware(false);
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse("C:/Users/Administrator/Desktop/test.xml");
System.out.println(doc.getChildNodes().getLength());
XPathFactory xFactory = XPathFactory.newInstance();
XPath xpath = xFactory.newXPath();
XPathExpression expr = xpath
.compile("//name/text()");
Object result = expr.evaluate(doc, XPathConstants.NODESET);
NodeList nodes = (NodeList) result;
System.out.println(nodes.getLength());
for (int i = 0; i < nodes.getLength(); i++) {
System.out.println(nodes.item(i).getNodeValue());
}
}
}
1、結點類型
XPath中有七種結點類型:元素、屬性、文本、定名空間、處置指令、正文和文檔節點(或成為根節點)。 文檔的根節點等於文檔結點;對應屬性有屬性結點,元素有元素結點。
2、經常使用途徑表達式
表達式 描寫
nodename 拔取此節點的一切子節點
/ 從根節點拔取
// 從婚配選擇確當前節點選擇文檔中的節點,而不斟酌它們的地位
. 拔取以後節點
.. 拔取以後節點的父節點
@ 拔取屬性
例若有文檔:
<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>
<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>
</bookstore>
則:
途徑表達式 成果
bookstore 拔取 bookstore 元素的一切子節點
/bookstore 拔取根元素 bookstore 正文:假設途徑肇端於正斜槓( / ),則此途徑一直代表到某元素的相對途徑!
bookstore/book 拔取一切屬於 bookstore 的子元素的 book 元素。
//book 拔取一切 book 子元素,而不論它們在文檔中的地位。
bookstore//book 選擇一切屬於 bookstore 元素的子女的 book 元素,而不論它們位於 bookstore 之下的甚麼地位。
//@lang 拔取一切名為 lang 的屬性。
3、限制語
用來查找某個特定的節點或許包括某個指定的值的節點。以方括號括起。
例如:
途徑表達式 成果
/bookstore/book[1] 拔取屬於 bookstore 子元素的第一個 book 元素。
/bookstore/book[last()] 拔取屬於 bookstore 子元素的最初一個 book 元素。
/bookstore/book[last()-1] 拔取屬於 bookstore 子元素的倒數第二個 book 元素。
/bookstore/book[position()<3] 拔取最後面的兩個屬於 bookstore 元素的子元素的 book 元素。
//title[@lang] 拔取一切具有名為 lang 的屬性的 title 元素。
//title[@lang='eng'] 拔取一切 title 元素,且這些元素具有值為 eng 的 lang 屬性。
/bookstore/book[price>35.00] 拔取一切 bookstore 元素的 book 元素,且個中的 price 元素的值須年夜於 35.00。
/bookstore/book[price>35.00]/title 拔取一切 bookstore 元素中的 book 元素的 title 元素,且個中的 price 元素的值須年夜於 35.00。
4、通配符
通配符 描寫
* 婚配任何元素節點
@* 婚配任何屬性節點
node() 婚配任何類型的節點
| 拔取若干途徑
例如:
途徑表達式 成果
/bookstore/* 拔取 bookstore 元素的一切子節點
//* 拔取文檔中的一切元素
//title[@*] 拔取一切帶有屬性的 title 元素。
//book/title | //book/price 拔取一切 book 元素的 tilte 和 price 元素。
//title | //price 拔取一切文檔中的 title 和 price 元素。
/bookstore/book/title | //price 拔取一切屬於 bookstore 元素的 book 元素的 title 元素,和文檔中一切的 price 元素。
5、函數
稱號 成果
ancestor 拔取以後節點的一切前輩(父、祖父等)
ancestor-or-self 拔取以後節點的一切前輩(父、祖父等)和以後節點自己
attribute 拔取以後節點的一切屬性
child 拔取以後節點的一切子元素。
descendant 拔取以後節點的一切子女元素(子、孫等)。
descendant-or-self 拔取以後節點的一切子女元素(子、孫等)和以後節點自己。
following 拔取文檔中以後節點的停止標簽以後的一切節點。
namespace 拔取以後節點的一切定名空間節點
parent 拔取以後節點的父節點。
preceding 拔取文檔中以後節點的開端標簽之前的一切節點。
preceding-sibling 拔取以後節點之前的一切同級節點。
self 拔取以後節點。
途徑表達式可所以相對途徑,也能夠是絕對途徑。例如:
相對地位途徑:
/step/step/...絕對地位途徑:
step/step/...個中的每步又可所以一個表達式,包含:
軸(函數)(axis)
界說所選節點與以後節點之間的樹關系
節點測試(node-test)
辨認某個軸外部的節點
零個或許更多謂語(predicate)
更深刻地提煉所選的節點集
例如: 例子 成果
child::book 拔取一切屬於以後節點的子元素的 book 節點
attribute::lang 拔取以後節點的 lang 屬性
child::* 拔取以後節點的一切子元素
attribute::* 拔取以後節點的一切屬性
child::text() 拔取以後節點的一切文簿子節點
child::node() 拔取以後節點的一切子節點
descendant::book 拔取以後節點的一切 book 子女
ancestor::book 選擇以後節點的一切 book 前輩
ancestor-or-self::book 拔取以後節點的一切book前輩和以後節點(假設此節點是book節點的話)
child::*/child::price 拔取以後節點的一切 price 孫。
6、運算符
運算符 描寫 實例 前往值
| 盤算兩個節點集 //book | //cd 前往一切帶有 book 和 ck 元素的節點集
+ 加法 6 + 4 10
- 減法 6 - 4 2
* 乘法 6 * 4 24
div 除法 8 div 4 2
= 等於 price=9.80 假如 price 是9.80,則前往 true。 假如 price 是9.90,則前往 fasle。
!= 不等於 price!=9.80 假如 price 是 9.90,則前往 true。 假如 price 是 9.98,則前往 fasle。
< 小於 price<9.80 假如price是9.00,則前往true 假如price是9.98,則前往fasle
<= 小於或等於 price<=9.80 假如 price 是9.00,則前往 true。 假如 price 是9.90,則前往 fasle。
> 年夜於 price>9.80 假如 price 是 9.90,則前往 true。 假如 price 是 9.80,則前往 fasle。
>= 年夜於或等於 price>=9.80 假如 price 是 9.90,則前往 true。 假如 price 是 9.70,則前往 fasle。
or 或 price=9.80 or price=9.70 假如 price 是 9.80,則前往 true。 假如 price 是 9.50,則前往 fasle。
and 與 price>9.00 and price<9.90 假如 price 是 9.80,則前往 true。 假如 price 是 8.50,則前往 fasle。
mod 盤算除法的余數 5 mod 2 1
7、在Java中應用Xpath
在java1.5中推出了一個javax.xml.xpath包專門用來在java中應用Xpath表達式來讀取xml。1. 數據類型
在進修之前起首須要留意的是:Xpath的數據其實不與Java有逐個對應關系,Xpath1.0只聲清楚明了四種數據類型:
•node-set
•number
•boolean
•string
對應到java就是:
•number 映照為 java.lang.Double
•string 映照為 java.lang.String
•boolean 映照為 java.lang.Boolean
•node-set 映照為 org.w3c.dom.NodeList
是以,在應用java的xpathAPI時,須要留意前往類型:
Java代碼
public Object evaluate(Object item, QName returnType)throws XPathExpressionException;
public String evaluate(Object item)throws XPathExpressionException;
public Object evaluate(InputSource source, QName returnType)throws XPathExpressionException;
public String evaluate(InputSource source)throws XPathExpressionException;
public Object evaluate(Object item, QName returnType)throws XPathExpressionException;
public String evaluate(Object item)throws XPathExpressionException;
public Object evaluate(InputSource source, QName returnType)throws XPathExpressionException;
public String evaluate(InputSource source)throws XPathExpressionException;
不指定前往類型時,缺省前往類型為String。指定前往類型時,須要把前往值由Object類型強迫轉換成對應的前往類型。
API的應用
相似於Dom,要獲得一個Xpath對象,可以以下應用: Java代碼
XPathFactory factory = XPathFactory.newInstance();
XPath xpath = factory.newXPath();
XPathExpression expression = xpath.compile("/bookstore//book/title/text()");
<strong><strong> XPathFactory factory = XPathFactory.newInstance();
XPath xpath = factory.newXPath();
XPathExpression expression = xpath.compile("/bookstore//book/title/text()");</strong></strong>
照樣以之前的xml文檔為例。要獲得這個表達式的成果,我們先要獲得一個輸出對象,例如一個document:
DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder documentBuilder = builderFactory.newDocumentBuilder();
Document document = documentBuilder.parse(new File("books.xml"));
NodeList list = (NodeList) expression.evaluate(document,XPathConstants.NODESET);
<strong><strong> DocumentBuilderFactory builderFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder documentBuilder = builderFactory.newDocumentBuilder();
Document document = documentBuilder.parse(new File("books.xml"));
NodeList list = (NodeList) expression.evaluate(document,XPathConstants.NODESET);</strong></strong>
這裡可以看出,在應用Xpath的時刻,我們似乎須要很清晰的曉得前往成果是甚麼。不然就不克不及獲得意想的成果。
最初,我們獲得一個title的list值:
for(int i = 0;i<list.getLength();i++){ System.out.println(list.item(i).getNodeValue());
}
<strong><strong> for(int i = 0;i</strong></strong>
Everyday Italian
Harry Potter
XQuery Kick Start
Learning XML
<strong><strong>Everyday Italian
Harry Potter
XQuery Kick Start
Learning XML</strong></strong>
8、處置敕令空間普通一個標准xml都邑有定名空間的界說,例如:
<strong><strong>
Hello
</strong></strong>
<?xml version="1.0" encoding="UTF-8"?>
<tg:bookstore xmlns:tg="http://www.tibco.com/cdc/liugang"
xmlns:ns="http://www.tibco.com/cdc/liugang/ns">
<ns:book>
<tg:title>Hello</tg:title>
</ns:book>
</tg:bookstore>
xpath中界說了與節點名和定名空間有關的三個函數:
•local-name()
•namespace-uri()
•name()
例如要查找一切在以後文檔中界說的,元素的local名為book的結點,則以下:
XPathFactory xPathFactory = XPathFactory.newInstance();
XPath xpath = xPathFactory.newXPath();
XPathExpression compile = xpath.compile("//*[local-name()='book']");
NodeList list = (NodeList) compile.evaluate(document,XPathConstants.NODESET);
<strong><strong> XPathFactory xPathFactory = XPathFactory.newInstance();
XPath xpath = xPathFactory.newXPath();
XPathExpression compile = xpath.compile("//*[local-name()='book']");
NodeList list = (NodeList) compile.evaluate(document,XPathConstants.NODESET);</strong></strong>
假如元素界說了定名空間,則應用xpath查找時也必需指定在統一個定名空間中,即使元素應用的是缺省的定名空間,剛查找也須要界說缺省的定名空間。 例如文檔:
<?xml version="1.0" encoding="UTF-8"?>
<bookstore xmlns="http://www.tibco.com/cdc/liugang" xmlns:tg="http://www.tibco.com/cdc/liugang/tg"
xmlns:ns="http://www.tibco.com/cdc/liugang/ns">
<ns:book>
<tg:title>Hello</tg:title>
</ns:book>
<computer>
<id>ElsIOIELdslke-1233</id>
</computer>
</bookstore>
<strong><strong>
Hello
ElsIOIELdslke-1233
</strong></strong>
界說了三個定名空間:缺省的;xmlns:tg;xmlns:ns。 要應用定名空間,我們須要設置XPath的定名空間高低文:NamespaceContext。這是一個接口類型,我們須要自界說去完成它。例如對應於上文檔的三個定名空間,可以以下完成:
class CustomNamespaceContext implements NamespaceContext{
public String getNamespaceURI(String prefix) {
if(prefix.equals("ns")){
return "http://www.tibco.com/cdc/liugang/ns";
}else if(prefix.equals("tg")){
return "http://www.tibco.com/cdc/liugang/tg";
}else if(prefix.equals("df")){
return "http://www.tibco.com/cdc/liugang";
}
return XMLConstants.NULL_NS_URI;
}
public String getPrefix(String namespaceURI) {
return null;
}
public Iterator getPrefixes(String namespaceURI) {
return null;
}
}
<strong><strong>class CustomNamespaceContext implements NamespaceContext{
public String getNamespaceURI(String prefix) {
if(prefix.equals("ns")){
return "http://www.tibco.com/cdc/liugang/ns";
}else if(prefix.equals("tg")){
return "http://www.tibco.com/cdc/liugang/tg";
}else if(prefix.equals("df")){
return "http://www.tibco.com/cdc/liugang";
}
return XMLConstants.NULL_NS_URI;
}
public String getPrefix(String namespaceURI) {
return null;
}
public Iterator getPrefixes(String namespaceURI) {
return null;
}
}</strong></strong>
辦法名都異常直不雅。這裡只完成第一個辦法。 如許,假如要查找定名空間是缺省,元素名為computer的一切元素,可以以下完成:
XPathFactory xPathFactory = XPathFactory.newInstance();
XPath xpath = xPathFactory.newXPath();
xpath.setNamespaceContext(new CustomNamespaceContext());
XPathExpression compile = xpath.compile("//df:computer");
NodeList list = (NodeList) compile.evaluate(document,XPathConstants.NODESET);
for(int i = 0;i
Node item = list.item(i);
System.out.println(item.getNodeName()+" "+item.getNodeValue());
}
<strong><strong> XPathFactory xPathFactory = XPathFactory.newInstance();
XPath xpath = xPathFactory.newXPath();
xpath.setNamespaceContext(new CustomNamespaceContext());
XPathExpression compile = xpath.compile("//df:computer");
NodeList list = (NodeList) compile.evaluate(document,XPathConstants.NODESET);
for(int i = 0;i</strong></strong>
9、其他
除此以外,在java中,還可以界說擴大的函數說明器和變量說明器,看XPath的辦法:
/**
*
Establish a variable resolver.
*
*
A NullPointerException is thrown if resolver is null.
*
* @param resolver Variable resolver.
*
* @throws NullPointerException If resolver is null.
*/
public void setXPathVariableResolver(XPathVariableResolver resolver);
/**
*
Establish a function resolver.
*
*
A NullPointerException is thrown if resolver is null.
*
* @param resolver XPath function resolver.
*
* @throws NullPointerException If resolver is null.
*/
public void setXPathFunctionResolver(XPathFunctionResolver resolver);
<strong><strong> /**
* Establish a variable resolver.
*
* A <code>NullPointerException</code> is thrown if <code>resolver</code> is <code>null</code>.
*
* @param resolver Variable resolver.
*
* @throws NullPointerException If <code>resolver</code> is <code>null</code>.
*/
public void setXPathVariableResolver(XPathVariableResolver resolver);
/**
* Establish a function resolver.
*
* A <code>NullPointerException</code> is thrown if <code>resolver</code> is <code>null</code>.
*
* @param resolver XPath function resolver.
*
* @throws NullPointerException If <code>resolver</code> is <code>null</code>.
*/
public void setXPathFunctionResolver(XPathFunctionResolver resolver);</strong></strong>