Schema,即XML Schema,XSD (XML Schema Definition)是
W3C于2001年5月发布的推荐标准,指出如何形式描述
XML文档的元素。XSD是许多XML Schema 语言中的一支。XSD是首先分离于XML本身的schema语言,故获取W3C的推荐地位。
简介
Schema,即XML Schema,XSD (XML Schema Definition)是
W3C于2001年5月发布的推荐标准,指出如何形式描述XML文档的元素。XSD是许多XML Schema 语言中的一支。XSD是首先分离于XML本身的schema语言,故获取W3C的推荐地位。
像所有XML Schema 语言一样,XSD用来描述一组规则──一个XML文件必须遵守这些规则,才能根据该schema‘合法(Valid)’。
然而,与其他XML Schema 语言不同,XSD意图设计为在确认一个文档的有效性时,将会产生满足特定
数据类型的一个信息集合。这种后验证的
XML信息集可用来开发XML文件处理软件。
XSD名称的来源
因为有其他XML schema 语言存在,故在引用这W3C建议的语言时,使用XML Schema或W3C XML Schema,Schema永远前缀大写。
“XML Schema”在2001年5月成为W3C推荐标准。由于“XML Schema”作为一种W3C的推荐标准的名字与广义的XML Schema 语言存在名称上的混淆,用户社区的一部分人采用了“WXS”来称呼它, 用户社区的另一部分人采用“XSD”(XMLSchemaDefinition首字母缩略字)来称呼它。W3C发布的1.1标准采用了“XSD”作为官方称呼。
历史
在官方文档的参考附录里,XSD标准承认受到[文件类型描述|DTD]]和其他早期XML schema 语言的影响,如
DDML、SOX、XML-Data、以及
XDR。XSD从中吸收了一些特性,然而也在这些特性中有所折衷。这些早期schema 语言中的XDR与SOX在XML Schema发布后仍继续使用了一段时间。不少
微软的产品支持XDR直到2006年十二月
MSXML6.0的发布(MSXML 6.0抛弃了XDR改用XSD)[1]。Commerce One, Inc支持它自己的SOX schema 语言直到该公司于2004年末破产。2004年十二月,Novell, Inc.购买了该公司,包括那些与SOX相关的专利,据报导是尽力防止被某些不相关的、以打专利相关官司为生的公司剥削图利
[2]。
著名的XSD建议的内容但在XML自己的DTD中不可用的特性是名字空间感知(namespace awareness)与数据类型。
2012年4月, XSD 1.1成为W3C推荐标准。April 2012
Schema与schema文档
技术上说schema是元数据的一个抽象集合,包含一套schema component: 主要是元素与属性的声明、复杂与简单数据类型的定义。这些schema component通常是在处理一批schema document时被创建。schema文档包含着schema component的源语言定义。在日常使用中,一个schema文档常被称作一个schema。
Schema文档通过名字空间组织起来:所有的被命名的schema component属于一个目标名字空间;这个目标名字空间是schema文档作为整体的一个属性。schema文档可以包含进来(include)使用同一名字空间的其它schema文档,也可以导入(import)使用不同名字空间的schema文档。
当一个实例文档针对一个schema来验证有效性时(这一过程称为assessment),用来验证有效性的schema可以作为参数提供过验证器,也可以在实例文档中作为两种特殊属性之一直接提供:
XML Schema Documents通常有
文件扩展名互联网媒体类型Schema component
主要的schema component有:
其它更专门的schema component包括annotations, assertions, notations, 以及包含了schema整体信息的schema component.
数据类型
简单数据类型(simple type)包含了可以出现在元素或属性的文本值。这是XSD与DTD的最大区别。
XSD提供了一套19个基本数据类型:
可以从这些基本数据类型通过三种机制构建三种数据类型:
XSD规范定义了25个导出数据类型。用户可以在schema中进一步定义自己的导出类型。
Restriction机制包括指出最大最小值、
正则表达式、限制字符串的长度、限制十进制数的位数等。XSD 1.1又增加了assertions, 即通过一个[XPath 2.0]]表达式给出任意约束的能力。
复杂数据类型描述了一个元素的许可内容。包括这个元素、属性、子元素的许可内容。复杂类型定义由一套属性使用与一个内容模型组成。内容模型可以是:
复杂数据类型可以从别的复杂类型导出:
XSD 1.1又增加了assertion方法来约束复杂类型, 即通过一个[XPath 2.0]]表达式必须求值为真
后Schema验证信息集
经过XML Schema为基的验证后,可以依照验证所隐含的
数据模型来表达文档的结构与内容。XML Schema数据模型包括:
这种对XML数据访问的特别的面向对象程序设计实现主要为
微软──对XML Schema发展的主要贡献者──所倡导。转换一份XML文件到自行
数据类型感知对象在某些软件设计部分相当有利。然而批评家争论这同时暗中破坏了开放性──XML的主要特征──并且它偏向于兼容原生于微软偏好的编程语言的资源类型[3]。
另,从XML Schema数据类型继承出去的(以及肇因于XML Schema数据类型的)限制、这些数据类型与其他XML Schema间受限的搭配、以及在其他W3C规格里这些数据类型的相依性,是许多XML软件发展师的争论焦点[4]。
XML Schema的次要用途
XML Schema的主要用途是形式描述XML文档,然而最终的schema除了简单验证文档外还有许多其他用途。
代码生成
Schema可用于生成代码,这称作{[tsl|en|XML Data Binding}}。这些代码允许XML文档的内容作为编程环境中的对象。
XML文件结构文档的生成
Schema可用于产生人可读的文档来描述一个XML文件的结构。这在作者利用了标记元素(annotation element)时非常有用。
批评
虽然XML Schema获取了广泛的成功应用,但也受到了大量严厉的批评,远超出其他W3C推荐标准。下述研究者很好地总结了这些批评:James Clark,Anders Møller与Michael Schwartzbach,Rick Jelliffe,David Webber.
一般问题
表达能力的实践限制
技术问题
参见