Javaweb学习笔记——（六）——————xml中jaxp两种解析方式和dom4j运用-CFANZ编程社区

1.xml的scheam约束

 dtd的语法：<!ElEMENT 元素名称 约束>

 **schema符合xml的语法，xml语句

 **一个xml中可以有多个schema，多个schema使用名称空间区分（类似于Java的包名）

 **dtd里面有PADATA类型，但是在schema里面可以支持更多的数据类型

 ***比如 年龄 只能是整数，在schema可以直接定义一个整数类型

 

 *** schema语法更加复杂，schema还不能替代dtd



2.schema的快速入门

 *创建一个schema文件

 **根节点：<schema>

 *步骤

 （1）看xml中有多少个元素

 <element>



 **在schema文件里面

 **属性
 xmlns="http://www.w3.org/2001/XMLSchema" 

 -表示当前xml文件是一个约束文件

 targetNamespace="http://www.example.org/1"

 -使用schema约束文件，直接通过这个地址引入约束文件 

 elementFormDefault="qualified"



 步骤

 （1）看xml中有多少个元素

 <element>

 （2）看简单元素和复杂元素

 *如果复杂元素

 <complexType>

 <sequence>

 子元素
 

 </sequence>

 </complexType>



 （3）如果简单元素，写在复杂元素的

 <element name="person">

 <complexType>

 <sequence>

 <element name="name" type="string"></element>

 <element name="age" type="int"></element>

 </sequence>

 </complexType>

 </element>



 （4）在被约束文件里面引入约束文件

 <person xmlns:xsi="http://www.w3.org/2001/XMLSchema"

 xmlns="http://www.example.org/1"

 xsi:schemaLocation="http://www.example.org/1 1.xsd">



 **xmlns：xsi="http://www.w3.org/2001/XMLSchema"

 --表示xml是一个被约束文件



 **xmlns="http://www.example.org/1"

 --是约束文档里面 targetNamespace

 **xsi:schemaLocation="http://www.example.org/1 1.xsd"

 --targetNamespace 空格 约束文档的地址路径



 *<Sequance>：表示元素的出现的顺序

 <all>：元素只能出现一次

 <choice>：元素只能出现其中的一个

 maxOccurs="unbounded"：表示元素的出现的次数

 <any></any>：表示任意元素



 *可以约束属性

 *写在复杂元素里面

 ***写在 </complexType>之前

 --

 <attribute name="id1" type="int" use="required"></attribute>

 -name：属性名称

 -type：属性类型 int string

 -use：属性是否必须出现required



 *复杂的schema约束

 <company xmlns = "http://www.w3.org/2001/XMLSchema"

 xmlns:dept="http://www.example.org/department"

 xmlns:xsi="http://www.w3.org/2001/XMLScema-instance"

 xsi:schemaLocation="http://www.example.org/company company.xsd http://www.example.org/departent department.xsd"

 >



 *引入多个schema文件，可以给每个起一个别名



 <employee age="30">

 部门名称

 <dept:name>100</dept:name>

 *想要引入部门的约束文件里面的name，使用部门的别名 detp：元素名称

 员工名称

 <name>王晓晓</name>

 </employee>



3.sax解析的原理

 *解析xml有两种技术 dom和sax



 *根据xml中的层级结构在内存中分配一个树形结构

 **把xml中标签，树形，文本封装成对象



 *sax方式：事件驱动，边读边解析

 *在javax.xml.parsers包里面

 ** SAXParser

 此类的实例可以从 SAXParserFactory.newSAXParser() 方法获得

 -parse(File f, DefaultHandler dh)

 *两个参数

 **第一参数：xml的路径

 *事件处理器

 ** SAXParserFactory 

 实例 newInstance() 方法得到

 *画图分析一下sax执行过程

 *当解析到开始标签的时候，自动执行startElement方法

 *当解析到文本的时候，自动执行characters方法

 *当解析到结束标签的时候，自动执行endElement方法



4.使用jaxp的sax方式解析xml

 *sax方式不能实现增删改查操作，只能做查询操作

 **打印出整个文档

 ***回写parse方法，第一个参数xml路径，第二个参数 事件处理器

 ***创建一个类，继承事件处理器的类

 ***重写里面的三个方法



 *获取到所有的name元素的值

 **定义一个成员变量 flag = false

 **判断开始方法是否是name元素，如果是name元素，把flag值设置为true

 **如果flag值为true，才characters方法里面打印内容

 **当执行到结束方法的时候吧flag值设置成false



 *获取到第一个name元素的值

 **定义一个成员变量 index = 1

 **在结束方法时候，将 index++

 **想要打印出第一个name元素的值，

 -在characters方法里面判断

 --判断flag=true 并且 index == 1，再打印内容



5.使用dom4j解析xml

 *dom4j，是一个组织，针对xml解析，提供解析器 dom4j



 *dom4j不是javase的一部分，想要使用第一步需要怎么做？

 ***导入dom4j提供jar包

 --创建一个文件夹lib

 --复制jar包到lib下面

 --右击jar包，build path——add to buildpath

 --看到jar包，变成奶瓶样子，表示导入成功



 *得到document

 SAXReader reader = new SAXReader();

 Document document = reader.read(url);

 *document的父接口是Node

 *如果在document里面找不到想要的方法，到Node里面去找



 *document里面的方法：getRootRlement()：获取根节点 返回的是Element



 *Element也是一个接口，父接口是Node

 -Element和Node里面的方法

 ** getParent()：获取父节点

 ** addElement：添加标签





 * elemnt(qname)   

 **表示获取标签下面的第一个子标签

 **qname：标签的名称

 * elements(qname)

 **获取标签下面是这个名称的所有的子标签(一层)

 **qname：标签名称

 *elements()

 **获取标签下面的所有的一层子标签





6.使用dom4j查询xml

 *解析是从上到下来解析的

 *查询所有name元素里面的值

 /*

 1.创建解析器

 2.得到document

 3.得到根节点
 getRootElenment() 返回Element

 4.得到所有的p1标签

 *element("p1") 返回list集合

 *遍历list得到每一个p1

 5.得到name

 *在p1下面执行 element("name")方法 返回Element

 6.得到name里面的值

 *getText()得到里面的值

 */



 *查询第一个name元素的值

 /*

  * 1.创建解析器

  * 2.得到document

  * 3.得到根节点

  * 

  * 4.得到第一个p1元素

  
 **element("p1")方法 返回Element

  * 5.得到p1下面的name

  
 **element("name")方法 返回Element

  * 6.得到name里面的值

  
 **getText()方法

  */



 *获取第二个name元素的值

 /*

  * 1.创建解析器

  * 2.得到document

  * 3.得到根节点

  * 

  * 4.得到第二个p1

  
 **返回list集合

  * 5.得到p1下面的name

  
 **使用list下标得到get方法，集合的下标从0开始，想要得到第二个值，下标写1

  * 6.得到name里面的值

  
 **getText方法

  */



7.使用dom4j实现添加操作

 *在第一个p1标签末尾添加一个元素 <sex>nan</sex>

 *步骤：

 /*

  * 1.创建解析器

  * 2.得到document

  * 3.得到根节点

  * 

  * 4.获取到第一个p1

  
 *使用element方法

  * 5.在p1下面添加元素

  
 *在p1上面直接使用addElement("标签名称")方法 返回一个Element

  * 6.在添加完成之后的元素下面添加文本

  
 在sex上直接使用 setText("文本内容");方法

  * 

  * 7.回写xml

  
 *格式化 OutputFormat，使用 createPrettyPrint方法，表示一个漂亮的格式

  
 *使用类XMLWriter 直接new这个类，传递这个两个参数

  
 ***第一个参数是xml文件路径 new FileOutputStream("路径");

  
 ***第二个参数是格式化类的值

  */

8.使用dom4j在特定的位置添加一个元素

 *在第一个p1下面的age标签之前添加一个 <school>JJU</school>

 *步骤

 /*

  * 1.创建解析器

  * 2.得到document

  * 3.得到根节点

  * 

  * 4.获得到第一个p1

  * 

  * 5.获取p1下面的所有的元素

  * 
 **elements()方法 返回 list集合

  * 
 **使用list里面的方法，在list里面添加元素

  * 
 **创建元素，在元素下面创建文本

  
 -使用createElement(QName qname);创建标签

  
 -把文本添加到标签下面，使用 setText("文本内容")方法



  * 
 ***add(int index, E element)

  * 
 -第一个参数是位置下标，从0开始

  * 
 -第二个参数是要添加的元素

  * 

  * 6.回写xml

  */



 **可以对得到document的操作和回写xml的操作，封装成方法

 **也可以吧传递的文件路径，封装成一个常量

 ***好处：可以提高开发速度，可以提高代码的可维护性

 -比如想要修改文件路径（名称），这个时候只需要修改常量的值就可以了，其他代码不需要改变



9.使用dom4j实现修改节点的操作

 *修改第一个p1下面的age元素的值 <age>30</age>

 *步骤

 /*

  * 1.得到document

  * 2.得到根节点，然后第一个p1元素.

  * 3.得到p1下面的age

  
 element("")方法

  * 4.修改值是30

  
 *使用setText("文本内容")方法

  * 

  * 5.回写xml

  */



10.使用dom4j来实现删除节点的操作

 *删除第一个p1下面的<school>JJU</school>元素

 *步骤

 /*

  * 1.得到document

  * 2.得到根节点

  * 3.得到第一个p1标签

  * 4.得到第一个p1下面的school元素

  * 5.删除（使用p1删除school）

  
 *得到school的父节点

  
 -第一种直接得到p1

  
 -使用方法 getParent方法得到

  
 *删除操作

  
 -在p1上面执行remove方法删除节点

  * 

  * 6.回写xml

  */



11.使用dom4j获取属性的需求

 *获取第一个p1里面的属性id的值

 *步骤

 /*

  * 1.得到document

  * 2.得到根节点

  * 3.得到第一个p1元素

  * 4.得到p1里面的属性值

  
 -p1.attributeValue("id");

  
 -在p1上面执行这个方法，里面的参数是属性名称

  */

 

 

12.使用dom4j支持xpath的操作

 *可以直接获取到某个元素



 *第一种形式

 /AAA/DDD/BBB：表示一层一层的，AAA下面的 DDD下面的BBB

 *第二种形式

 //BBB：表示和这个名称相同，表示只要名称是BBB，都得到

 *第三种形式

 /*：所有元素

 *第四种形式

 **
 BBB[1]：表示第一个BBB元素

 **
 BBB[last()]：表示最后一个BBB元素

 *第五种形式

 **
 //BBB[@id]：表示只要BBB元素上面有id属性，都得到

 *第六种形式

 **
 //BBB[@id='b1']：表示元素名称是BBB，在BBB上面有id属性，并且id的属性值是b1





13.使用dom4j支持xpath具体操作

 **默认的情况下，dom4j不支持xpath

 **如果想要在dom4j里面是有xpath

 *第一步需要，引入支持xpath的jar包，使用jaxen-xxxx.jar

 **需要把jar包导入到项目中

 **在dom4j里面提供了两个方法，用来支持xpath

 ***
 selectNodes("xpath的表达式")

 -获取多个节点

 ***selectSingleNode("xpath表达式")

 -获取一个节点



 **使用xpath实现：查询xml中所有的name元素的值

 **所有name元素的xpath表示：  //name

 **使用selectNodes("//name");

 **代码和步骤

 public static void test1(){

 /*

  * 1.得到document

  * 2.直接使用selectNodes("//name")方法的到所有的name元素

  * 

  */

 

 //得到document

 Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

 

 //直接使用selectNodes("//name")方法的到所有的name元素

 List<Node> list = document.selectNodes("//name");

 

 //遍历list集合

 for(Node node : list){

 //node是每一个name元素

 //得到name元素里面的值

 String name = node.getText();

 

 System.out.println(name);

 

 }

 }



 **使用xpath实现：获取第一个p1下面的name的值

 *
 //p1[@id='aaa']/name

 *使用到selectSingleNode("//p1[@id='aaa']/name")

 *步骤和代码

 public static void test2() {

 /*

  * 1.得到document

  * 2.直接使用selectSingleNode方法实现

  * 
 - xpath：//p1[@id='aaa']/name

  */

 

 //得到document

 Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

 

 //直接使用selectSingleNode方法实现

 Node name = document.selectSingleNode("//p1[@id='aaa']/name");

 

 //获取name元素下面的值

 String nameStr = name.getText();

 

 System.out.println(nameStr);

 

 }





14.实现简单的学生管理系统

 **使用xml当做一个数据库，存储学生信息



 **创建一个xml文件，写一些学生信息



 **增加操作

 //增加

 public static void addStu(Student student){

 /*

  * 1.创建解析器

  * 2.得到document

  * 3.得到根节点

  * 4.在根节点上面添加stu标签

  * 5.在stu标签上面依次添加id，name，age

  * 6.在id，name，age上面依次添加值

  
 **
 setText()操作

  * 

  * 7.回写xml

  */

 

 //直接通过工具类获取document

 Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

 

 //得到根节点

 Element root = document.getRootElement();

 

 //在根节点上添加stu

 Element stu = root.addElement("stu");

 

 //在根节点上添加id，name，age标签

 Element id = stu.addElement("id");

 Element name = stu.addElement("name");

 Element age = stu.addElement("age");

 

 //在各个属性标签上添加对应的值

 id.setText(student.getId());

 name.setText(student.getName());

 age.setText(student.getAge());

 

 

 //回写xml

 Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);

 

 //提示消息

 System.out.println("成功添加"+student.toString()+"的信息");



 }

 

 **删除操作（根据id删除）

 //删除

 public static void delStu(String id){

 /*

  * 1.通过Dom4jUtil工具类直接获取document

  * 2.得到根节点

  * 

  * 3.获取到所有的id

  * 
 使用xpath  //id 返回list集合

  * 4.遍历list集合

  * 5.判断集合里面的id和传递的id是否相同

  * 6.如果相同，就把id所在的stu删除(删除父节点，同时该结点下的结点都会被删除)

  * 

  * 7.回写xml

  */

 

 //获取document

 Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

 

 //获取所有的id

 List<Node> list = document.selectNodes("//id");

 

 //遍历list集合

 for(Node id2 : list){

 //判断id的值是否和方法中传过来的id相同

 if (id2.getText().equals(id)) {//相同

 //获取id2的父节点 stu

 Element stu = id2.getParent();

 //获取stu的父节点

 Element student = stu.getParent();

 

 //删除stu

 student.remove(stu);

 }

 }

 

 //回写xml

 Dom4jUtils.xmlWriters(Dom4jUtils.PATH, document);

 

 System.out.println("成功删除 "+id+" 学生的信息。");

 }



 **查询操作

 //查询

 //根据id来查询学生信息

 public static Student selectStu(String id) {

 /*

  * 1.根据Dom4jUtil工具直接获取document

  * 2.获取到所有的id标签

  * 3.返回的list集合，遍历集合

  * 4.得到每一个id节点，

  * 5.获取每一个id节点的值

  * 6.判断id的值，和传递过来的id值是否相同

  * 7.如果相同，则获得id的父节点stu

  * 8.获得stu中的name，age节点中的值



  
 **把这些值封装到一个对象中，返回对象

  */

 

 //获取document

 Document document = Dom4jUtils.getDocument(Dom4jUtils.PATH);

 

 //获取到所有的id标签

 List<Node> list = document.selectNodes("//id");

 

 //定义nameStr，ageStr

 String nameStr = "";

 String ageStr = "";

 

 //遍历

 for(Node id2 : list){

 //获得id节点上的值

 String idStr = id2.getText();

 if (idStr.equals(id)) {//相同

 //获取该节点的父节点stu

 Element stu = id2.getParent();

 

 //获取结点stu的name节点上的nameStr

 nameStr = stu.element("name").getText();

 

 //获取结点stu的age节点上的ageStr

 ageStr = stu.element("age").getText();

 

 System.out.println("查询到一个学生信息：");

 }

 }

 

 Student student = new Student(id, nameStr, ageStr);

 

 return student;

 }