目录
第一章XML基础
XML的起源
XML的定义
XML的应用
XML的组成
格式良好的XML
第二章DTD
第三章Schema
第四章DOM
第五章SAX
第六章dom4j
第一章XML基础
首先,学习一个新知识的时候需要从宏观把握它都涉及到了哪些方面,正如目录中看到的一样,其次,从微观入手,逐个击破。
XML(可扩展标记语言)与之前学到的HTML(超文本标记语言)一样都是标记语言,除了这俩种以外,还有哪些是标记语言呢?
XML的起源
了解XML之前先来复习HTML,看二者之间有何区别有何联系。
HTML
- HTML(HyperText Markup Language)
- HTML是互联网应用的最基础技术
- HTML关注的是数据的显示
- HTML的核心作用是信息的布局和显示
XML的定义
- XML(eXtensible Markup Language)
- XML是一种标记语言,类似HTML
- 可扩展标记语言
- XML标记都是自定义的
- XML设计宗旨是包含和传输数据
- XML是W3C的推荐标准
- XML标准的网址:http://www.w3.org/TR/REC-xml/
XML和HTML的区别:
- XML不是用来替换HTML的技术
- XML和HTML为不同的目的而设计。XML设计的核心是包含与传输数据;HTML设计的核心是显示数据。
XML的主要应用
- 作为系统的配置文件
- Ajax中传输数据
- Web Services中传输数据
- 异构平台(跨平台)的数据交换与整合
(1)XML实例
<?xml version="1.0" encoding="utf-8"?>
<书籍列表>
<计算机书籍>
<书名>XML的今生今世</书名>
<价格>66.66</价格>
<简要介绍>该书详细描写XML的从出生到衰老的整个生命周期</简要介绍>
</计算机书籍>
</书籍列表>
(2)XML格式
根元素
- XML文件的结构上是一种树状结构,它从“根部”开始,然后扩展到“枝叶”
- XML的内容必须包含在一个单一元素中。这个单一元素称为根元素,它包含文档中所有文本和所有其他元素。
- XML文件必须要有根元素
元素
- 元素是开始标签、结束标签以及位于二者之间的所有内容
- 元素是区分大小写的
- 元素要正确嵌套
- XML元素都必须正确关闭
- 父元素与子元素,栗子:
<book>
<author>
<name>刘伟</name>
<email>liuwei8809@163.com</email>
</author>
<isbn>12345</isbn>
</book>
实体引用
为了避免把字符数据和标签中需要用到的一些特殊符号相混淆,XML还提供了实体引用。
字符 | 实体引用 |
& | & |
> | > |
< | ⁢ |
" | " |
' | &spos; |
例如:如果想在XML页中显示书名号,如果是下面这种写法就会报错,因为程序会自动将《》与<>相混淆,识别不出书名号
<bookname>《XML应用大全》</bookname>
第一种正确的写法如下:
<bookname>&It;&It;XML应用大全>></bookname>
第二种正确的写法如下:
<bookname><![CDATA[《XML应用大全》]]></bookname>
属性
- 属性必须有值
- 那些值必须用引号括起
- 可以使用单引号,也可以使用双引号,但要始终保持一致
CDATA
在特殊的标签CDATA下,所有的标签,实体引用都被忽略,而被XML处理程序一视同仁的当做字符数据看待。
CDATA的形式如下:
<![CDATA[文本内容]]>
处理指示(PI)
- Processing instructions(PI)
- 指示当前的XML文件的内容,如何被显示或者处理
- 语法格式:<?target arg*?>
- 栗子:使用XSLT处理当前的XML文件
<?xml-stylesheet type="text/xsl" href="book.xsl"?>
格式良好的XML
格式良好的XML会遵守以下XML语法规则:
- XML文件必须有根元素
- XML文件必须有关闭标签
- XML标记对大小写敏感
- XML元素必须被正确的嵌套
- XML属性必须加引号