加载中…
个人资料
小徐老徐XDU
小徐老徐XDU
  • 博客等级:
  • 博客积分:0
  • 博客访问:789
  • 关注人气:46
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

XPath常用表达式

(2011-08-22 08:58:43)
标签:

xpath

教育

分类: Engineering

(转载自http://hi.baidu.com/cn_wangwei/blog/item/4ed5efd37eeb4a36960a16a6.html,纯粹为学习而整理,转载请标明原出处

XML 文档对象模型 (DOM) 
能够以编程方式读取、处理和修改 XML 文档。

XPath
表达式
XPath
表达式使用路径表示法(与 URL 中使用的路径表示法类似)寻址 XML 文档的各个部分。表达式计算为生成子元素集、布尔值、数字或字符串类型的对象。

URLXPath 表达式比较
URL:
由文件系统中的文件夹和文件组成的层次结构。
每个级别具有唯一名称的文件。URL 总是标识单个文件。
相对特定文件夹(称为当前文件夹)进行计算。
XPath:
XML 文档中的元素和其他元素组成的层次结构。
每个级别的元素名可能不是唯一的。XPath 表达式标识所有匹配的元素集。
相对特定元素(称为表达式的上下文)进行计算。

基本 XPath 表达式 (判断是谁的集合!!)
1.
当前上下文
  
以句点和正斜杠 (./) 作为前缀的表达式明确使用当前上下文作为上下文。例如,以下表达式引用当前上下文中的所有 <author> 元素:
    ./author
  
注意,此表达式等效于以下表达式:
    author

2.文档根
  
以正斜杠 (/) 为前缀的表达式使用文档树的根作为上下文。例如,以下表达式引用此文档根的 <bookstore> 元素:
    /bookstore
3.
根元素
  
使用正斜杠后接星号 (title 不同。
  
   bookstorelast-name
  
所有作为 <book> 元素的孙级的 <last–name> 元素。
  
   */*
  
当前上下文的所有孙级元素。
  
   my:book
   my
命名空间中的<book> 元素。
  
   my:*
   my
命名空间中的所有元素。
属性
XPath
使用 @ 符号表示属性名。属性和子元素应公平对待,两种类型之间的功能应尽可能相当。
例如:
   @style
  
当前元素上下文的 style 属性。
  
  
price/@exchange
  
当前上下文中 <price> 元素的 exchange 属性。
   
   
book/@style
   
所有 <book> 元素的 style 属性。
   
    @*
   
当前上下文节点的所有属性。
   
    @my:*  
    my
命名空间中的所有属性。不包括 my 命名空间中的元素的未限定属性。
   
  
注意:
   
属性不能包含子元素,所以,如果对属性应用路径运算符,将出现语法错误。此外,不能对属性应用索引,因为根据定义,不为属性定义任何顺序。
   
price/@exchange/total
比较
运算符:

   and  
逻辑与  
   or  
逻辑或 
   not()  
 
   
相等 
   !=  
不相等 
   &lt;  
小于 
   &lt;=  
小于或等于 
   &gt;  
大于 
   &lt;=  
大于或等于 
   
集运算;返回两个节点集的联合

例如:
   author[last-name = "Bob"]
  
至少包含一个值为 Bob <last-name> 元素的所有 <author> 元素。
  
   author[last-name[1] = "Bob"] 
  
第一个 <last-name> 子元素的值为 Bob 的所有<author> 元素。
  
   author/degree[@from != "Harvard"] 
  
包含 from 属性不等于 "Harvard" <degree> 元素的所有 <author> 元素。
  
   author[last-name = /editor/last-name] 
  
包含与根元素下 <editor> 元素中的 <last-name> 元素相同的 <last-name> 元素的所有 <author> 元素。
  
   author[. = "Matthew Bob"]
  
所有字符串值为 Matthew Bob <author> 元素。
集运算
Union (|)
运算符
|
(即 union)运算符返回两个操作数的联合,操作数必须是节点集。例如,//author | //publisher 返回的节点集结合了所有 //author 节点和所有 //publisher 节点。


例如:
   first-name | last-name 
  
包含当前上下文中的 <first-name> <last-name> 元素的节点集。

   (bookstore/book | bookstore/magazine) 
  
包含 <bookstore> 元素中的 <book> <magazine> 元素的节点集。
  
   book | book/author 
   
包含<book> 元素中的所有 <book> 元素和所有 <author> 元素的节点集。
  
   (book | magazine)/price 
   
包含<book> <magazine> 元素的所有 <price> 元素的节点集。

筛选器和筛选模式

通过将筛选子句 [pattern] 添加到集合中,可以对任何集合应用约束和分支。筛选器类似于 SQL WHERE 子句。筛选器中包含的模式称为筛选模式

例如:
   book[excerpt] 
  
至少包含一个 <excerpt> 元素的所有 <book> 元素。

   book[excerpt]/title 
  
至少包含一个 <excerpt> 元素的 <book> 元素内的所有 <title> 元素。

   book[excerpt]/author[degree] 
  
至少包含一个 <degree> 元素并且在至少包含一个 <excerpt> 元素的 <book> 元素内的所有 <author> 元素。

   book[author/degree] 
  
至少包含一个 <author> 元素并且该元素至少包含一个 <degree> 子元素的 <book> 所有元素。

   book[excerpt][title] 
  
至少包含一个 <excerpt> 元素以及至少包含一个 <title> 元素的 <book> 所有元素。

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有