xml基础

XML是什么?

●XML 指可扩展标记语言(EXtensible Markup Language)
●XML 是一种标记语言,很类似 HTML
●XML 的设计宗旨是传输数据,而非显示数据
●XML 标签没有被预定义。您需要自行定义标签。
●XML 被设计为具有自我描述性。
●XML 是 W3C 的推荐标准

XML与HTML的主要差异

XML 不是 HTML 的替代。
XML 和 HTML 为不同的目的而设计:
XML 被设计为传输和存储数据,其焦点是数据的内容。
HTML 被设计用来显示数据,其焦点是数据的外观。
HTML 旨在显示信息,而 XML 旨在传输信息。

一个简单的XML文件

<?xml version="1.0" encoding="UTF-8"?>
<body>
   <school>
      <teacher>Jack</teacher>
      <student>Mark</student>
   </school>
</body>

这是一个简单的XML文件,文件的第一行是XML的声明,version="1.0"指的是XML的版本,encoding="UTF-8"则是所使用的编码方式。注意:<?之间不能有空格,否则则会出错。

XML可以发明属于自己的标签

什么意思呢?在HTML中我们知道标签这个概念,但是HTML当中的标签是都是规定好的,标签当中不能有中文字符出现,但是在XML当中,我们可以使用中文标签:<中文>

图片.png
XML 文档形成一种树结构

XML 文档必须包含根元素。该元素是所有其他元素的父元素。
XML 文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。

父、子以及同胞等术语用于描述元素之间的关系。父元素拥有子元素。相同层级上的子元素成为同胞(兄弟或姐妹)。

所有元素均可拥有文本内容和属性(类似 HTML 中)。

图片.png

图片当中的根元素是 <bookstore>。文档中的所有 <book> 元素都被包含在 <bookstore> 中。
<book> 元素有 4 个子元素:<title>、< author>、<year>、<price>。

XML的标签必须是闭合的

在HTML当中,有些标签是无需闭合的。就像<p><h>等等。但是在XML中,不闭合的标签是非法的。

图片.png
图片.png
XML 标签对大小写敏感

在XML文档中,我们的标签是区分大小写的,我们必须确保我们写的标签大小写正确,不然也是会报错的。

实体引用

在 XML 中,一些字符拥有特殊的意义。
如果你把字符 "<" 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。
这样会产生 XML 错误:

图片.png

为了避免这个错误,用实体引用来代替 "<" 字符。

下面是5个预定义的实体引用:

图片.png
XML 元素 vs. 属性

请看下面的例子:

<person sex="female">
  <firstname>Anna</firstname>
  <lastname>Smith</lastname>
</person> 

<person>
  <sex>female</sex>
  <firstname>Anna</firstname>
  <lastname>Smith</lastname>
</person> 

在第一个例子中,sex 是一个属性。在第二个例子中,sex 则是一个子元素。两个例子均可提供相同的信息。没有什么规矩可以告诉我们什么时候该使用属性,而什么时候该使用子元素。但是在 HTML 中,属性用起来很便利,但是在 XML 中,应该尽量避免使用属性。如果信息感觉起来很像数据,那么请使用子元素吧。

文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。DTD 可被成行地声明于 XML 文档中,也可作为一个外部引用。
内部的 DOCTYPE 声明

<!DOCTYPE 根元素 [元素声明]>

请看下面的例子:

图片.png
图片.png

上面的例子报错了,因为在DTD当中规定了标签的顺序,先是teacher接着是student最后才是classroom,但是在XML中先写了classroom标签,因此报错了。

<?xml version="1.0"?>
<!DOCTYPE note [
  <!ELEMENT note (to,from,heading,body)>
  <!ELEMENT to      (#PCDATA)>
  <!ELEMENT from    (#PCDATA)>
  <!ELEMENT heading (#PCDATA)>
  <!ELEMENT body    (#PCDATA)>
]>
<note>
  <to>George</to>
  <from>John</from>
  <heading>Reminder</heading>
  <body>Don't forget the meeting!</body>
</note>
以上 DTD 解释如下:
●!DOCTYPE note (第二行)定义此文档是 note 类型的文档。
●!ELEMENT note (第三行)定义 note 元素有四个元素:"to、from、heading,、body"
●!ELEMENT to (第四行)定义 to 元素为 "#PCDATA" 类型
●!ELEMENT from (第五行)定义 from 元素为 "#PCDATA" 类型
●!ELEMENT heading (第六行)定义 heading 元素为 "#PCDATA" 类型
●!ELEMENT body (第七行)定义 body 元素为 "#PCDATA" 类型
外部文档声明

假如 DTD 位于 XML 源文件的外部,那么它应通过下面的语法被封装在一个 DOCTYPE 定义中:

<!DOCTYPE 根元素 SYSTEM "文件名">

这个 XML 文档和上面的 XML 文档相同,但是拥有一个外部的 DTD:

<?xml version="1.0"?>
<!DOCTYPE note SYSTEM "note.dtd">
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note> 

这是包含 DTD 的 "note.dtd" 文件:

<!ELEMENT note (to,from,heading,body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>
为什么使用 DTD?

通过 DTD,您的每一个 XML 文件均可携带一个有关其自身格式的描述。
通过 DTD,独立的团体可一致地使用某个标准的 DTD 来交换数据。
而您的应用程序也可使用某个标准的 DTD 来验证从外部接收到的数据。
您还可以使用 DTD 来验证您自身的数据。

未完待续。。。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1. XML简介 以下内容来自于http://www.w3school.com.cn/xml 基本知识 XML 和...
    WebSSO阅读 1,965评论 1 7
  • HTML(HyperText Markup Language),即超文本标记语言,是用于描述网页文档的一种描述标记...
    Yinag阅读 1,986评论 0 1
  • 经过两天的奋战,终于把xml简略的过了一遍。 1.1XML介绍 xml是Extensible Markup lan...
    Ystrator阅读 853评论 0 2
  • 问答题47 /72 常见浏览器兼容性问题与解决方案? 参考答案 (1)浏览器兼容问题一:不同浏览器的标签默认的外补...
    _Yfling阅读 13,815评论 1 92
  • 我以为我有了别人就可以不念你 可未曾想潜意识里还是深藏着你 我以为我的心没了你就不会砰砰直跳 可在梦里你又让它如小...
    风散种子阅读 141评论 0 0