(转载自http://hi.baidu.com/cn_wangwei/blog/item/4ed5efd37eeb4a36960a16a6.html,纯粹为学习而整理,转载请标明原出处)
XML
文档对象模型 (DOM)
能够以编程方式读取、处理和修改
XML
文档。
XPath
表达式
XPath
表达式使用路径表示法(与 URL
中使用的路径表示法类似)寻址 XML
文档的各个部分。表达式计算为生成子元素集、布尔值、数字或字符串类型的对象。
URL与XPath
表达式比较
URL:
由文件系统中的文件夹和文件组成的层次结构。
每个级别具有唯一名称的文件。URL
总是标识单个文件。
相对特定文件夹(称为“当前文件夹”)进行计算。
XPath:
由 XML
文档中的元素和其他元素组成的层次结构。
每个级别的元素名可能不是唯一的。XPath
表达式标识所有匹配的元素集。
相对特定元素(称为表达式的“上下文”)进行计算。
基本
XPath
表达式 (判断是谁的集合!!)
1.当前上下文
以句点和正斜杠 (./)
作为前缀的表达式明确使用当前上下文作为上下文。例如,以下表达式引用当前上下文中的所有 <author>
元素:
./author
注意,此表达式等效于以下表达式:
author
2.文档根
以正斜杠 (/)
为前缀的表达式使用文档树的根作为上下文。例如,以下表达式引用此文档根的 <bookstore>
元素:
/bookstore
3.根元素
使用正斜杠后接星号 (title
不同。
bookstorelast-name
所有作为 <book>
元素的孙级的 <last–name>
元素。
*/*
当前上下文的所有孙级元素。
my:book
my
命名空间中的<book>
元素。
my:*
my
命名空间中的所有元素。
属性
XPath
使用 @
符号表示属性名。属性和子元素应公平对待,两种类型之间的功能应尽可能相当。
例如:
@style
当前元素上下文的 style
属性。
price/@exchange
当前上下文中 <price>
元素的 exchange
属性。
book/@style
所有 <book>
元素的 style
属性。
@*
当前上下文节点的所有属性。
@my:*
my
命名空间中的所有属性。不包括 my
命名空间中的元素的未限定属性。
注意:
属性不能包含子元素,所以,如果对属性应用路径运算符,将出现语法错误。此外,不能对属性应用索引,因为根据定义,不为属性定义任何顺序。
price/@exchange/total
比较
运算符:
and
逻辑与
or
逻辑或
not()
非
=
相等
!=
不相等
<
小于
<=
小于或等于
>
大于
<=
大于或等于
|
集运算;返回两个节点集的联合
例如:
author[last-name =
"Bob"]
至少包含一个值为 Bob
的 <last-name>
元素的所有 <author>
元素。
author[last-name[1] =
"Bob"]
第一个 <last-name>
子元素的值为 Bob
的所有<author>
元素。
author/degree[@from !=
"Harvard"]
包含 from
属性不等于 "Harvard"
的 <degree>
元素的所有 <author>
元素。
author[last-name =
/editor/last-name]
包含与根元素下 <editor>
元素中的 <last-name>
元素相同的 <last-name>
元素的所有 <author>
元素。
author[. = "Matthew
Bob"]
所有字符串值为 Matthew Bob
的 <author>
元素。
集运算
Union (|)
运算符
|(即
union)运算符返回两个操作数的联合,操作数必须是节点集。例如,//author | //publisher
返回的节点集结合了所有 //author
节点和所有 //publisher
节点。
例如:
first-name |
last-name
包含当前上下文中的 <first-name>
和 <last-name>
元素的节点集。
(bookstore/book |
bookstore/magazine)
包含 <bookstore>
元素中的 <book>
或 <magazine>
元素的节点集。
book | book/author
包含<book>
元素中的所有 <book>
元素和所有 <author>
元素的节点集。
(book |
magazine)/price
包含<book>
或 <magazine>
元素的所有 <price>
元素的节点集。
筛选器和筛选模式
通过将筛选子句
[pattern]
添加到集合中,可以对任何集合应用约束和分支。筛选器类似于 SQL WHERE
子句。筛选器中包含的模式称为“筛选模式”。
例如:
book[excerpt]
至少包含一个 <excerpt>
元素的所有 <book>
元素。
book[excerpt]/title
至少包含一个 <excerpt>
元素的 <book>
元素内的所有 <title>
元素。
book[excerpt]/author[degree]
至少包含一个 <degree>
元素并且在至少包含一个 <excerpt>
元素的 <book>
元素内的所有 <author>
元素。
book[author/degree]
至少包含一个 <author>
元素并且该元素至少包含一个 <degree>
子元素的 <book>
所有元素。
book[excerpt][title]
至少包含一个 <excerpt>
元素以及至少包含一个 <title>
元素的 <book>
所有元素。
加载中,请稍候......