XML是什么?
●XML 指可扩展标记语言(EXtensible Markup Language)
●XML 是一种标记语言,很类似 HTML
●XML 的设计宗旨是传输数据,而非显示数据
●XML 标签没有被预定义。您需要自行定义标签。
●XML 被设计为具有自我描述性。
●XML 是 W3C 的推荐标准
XML与HTML的主要差异
XML 不是 HTML 的替代。
XML 和 HTML 为不同的目的而设计:
XML 被设计为传输和存储数据,其焦点是数据的内容。
HTML 被设计用来显示数据,其焦点是数据的外观。
HTML 旨在显示信息,而 XML 旨在传输信息。
一个简单的XML文件
<?xml version="1.0" encoding="UTF-8"?>
<body>
<school>
<teacher>Jack</teacher>
<student>Mark</student>
</school>
</body>
这是一个简单的XML文件,文件的第一行是XML的声明,version="1.0"
指的是XML的版本,encoding="UTF-8"
则是所使用的编码方式。注意:<?
之间不能有空格,否则则会出错。
XML可以发明属于自己的标签
什么意思呢?在HTML中我们知道标签这个概念,但是HTML当中的标签是都是规定好的,标签当中不能有中文字符出现,但是在XML当中,我们可以使用中文标签:<中文>
。
XML 文档形成一种树结构
XML 文档必须包含根元素。该元素是所有其他元素的父元素。
XML 文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。
父、子以及同胞等术语用于描述元素之间的关系。父元素拥有子元素。相同层级上的子元素成为同胞(兄弟或姐妹)。
所有元素均可拥有文本内容和属性(类似 HTML 中)。
图片当中的根元素是 <bookstore>。文档中的所有 <book> 元素都被包含在 <bookstore> 中。
<book> 元素有 4 个子元素:<title>、< author>、<year>、<price>。
XML的标签必须是闭合的
在HTML当中,有些标签是无需闭合的。就像<p>
,<h>
等等。但是在XML中,不闭合的标签是非法的。
XML 标签对大小写敏感
在XML文档中,我们的标签是区分大小写的,我们必须确保我们写的标签大小写正确,不然也是会报错的。
实体引用
在 XML 中,一些字符拥有特殊的意义。
如果你把字符 "<" 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。
这样会产生 XML 错误:
为了避免这个错误,用实体引用来代替 "<" 字符。
下面是5个预定义的实体引用:
XML 元素 vs. 属性
请看下面的例子:
<person sex="female">
<firstname>Anna</firstname>
<lastname>Smith</lastname>
</person>
<person>
<sex>female</sex>
<firstname>Anna</firstname>
<lastname>Smith</lastname>
</person>
在第一个例子中,sex 是一个属性。在第二个例子中,sex 则是一个子元素。两个例子均可提供相同的信息。没有什么规矩可以告诉我们什么时候该使用属性,而什么时候该使用子元素。但是在 HTML 中,属性用起来很便利,但是在 XML 中,应该尽量避免使用属性。如果信息感觉起来很像数据,那么请使用子元素吧。
文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。DTD 可被成行地声明于 XML 文档中,也可作为一个外部引用。
内部的 DOCTYPE 声明
<!DOCTYPE 根元素 [元素声明]>
请看下面的例子:
上面的例子报错了,因为在DTD当中规定了标签的顺序,先是teacher接着是student最后才是classroom,但是在XML中先写了classroom标签,因此报错了。
<?xml version="1.0"?>
<!DOCTYPE note [
<!ELEMENT note (to,from,heading,body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>
]>
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
以上 DTD 解释如下:
●!DOCTYPE note (第二行)定义此文档是 note 类型的文档。
●!ELEMENT note (第三行)定义 note 元素有四个元素:"to、from、heading,、body"
●!ELEMENT to (第四行)定义 to 元素为 "#PCDATA" 类型
●!ELEMENT from (第五行)定义 from 元素为 "#PCDATA" 类型
●!ELEMENT heading (第六行)定义 heading 元素为 "#PCDATA" 类型
●!ELEMENT body (第七行)定义 body 元素为 "#PCDATA" 类型
外部文档声明
假如 DTD 位于 XML 源文件的外部,那么它应通过下面的语法被封装在一个 DOCTYPE 定义中:
<!DOCTYPE 根元素 SYSTEM "文件名">
这个 XML 文档和上面的 XML 文档相同,但是拥有一个外部的 DTD:
<?xml version="1.0"?>
<!DOCTYPE note SYSTEM "note.dtd">
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note>
这是包含 DTD 的 "note.dtd" 文件:
<!ELEMENT note (to,from,heading,body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>
为什么使用 DTD?
通过 DTD,您的每一个 XML 文件均可携带一个有关其自身格式的描述。
通过 DTD,独立的团体可一致地使用某个标准的 DTD 来交换数据。
而您的应用程序也可使用某个标准的 DTD 来验证从外部接收到的数据。
您还可以使用 DTD 来验证您自身的数据。
未完待续。。。