# XML解析
对于以XML作为载体传递的数据,实际使用中需要对相关的节点进行解析,一般包括[解析XML标签和标签值](#解析xml标签和标签值)、[解析XML属性和属性值](#解析xml属性和属性值)、[解析XML事件类型和元素深度](#解析xml事件类型和元素深度)三类场景。
XML模块提供XmlPullParser类对XML文件解析,输入为含有XML文本的ArrayBufffer或DataView,输出为解析得到的信息。
**表1** XML解析选项
| 名称 | 类型 | 必填 | 说明 |
| -------- | -------- | -------- | -------- |
| supportDoctype | boolean | 否 | 是否忽略文档类型。默认为false,表示对文档类型进行解析。 |
| ignoreNameSpace | boolean | 否 | 是否忽略命名空间。默认为false,表示对命名空间进行解析。 |
| tagValueCallbackFunction | (name: string, value: string) => boolean | 否 | 获取tagValue回调函数,打印标签及标签值。默认为null,表示不进行XML标签和标签值的解析。 |
| attributeValueCallbackFunction | (name: string, value: string) => boolean | 否 | 获取attributeValue回调函数, 打印属性及属性值。默认为null,表示不进行XML属性和属性值的解析。 |
| tokenValueCallbackFunction | (eventType: EventType, value: ParseInfo) => boolean | 否 | 获取tokenValue回调函数,打印标签事件类型及parseInfo对应属性。默认为null,表示不进行XML事件类型解析。 |
## 注意事项
- XML解析及转换需要确保传入的XML数据符合标准格式。
- XML解析目前不支持按指定节点解析对应的节点值。
## 解析XML标签和标签值
1. 引入模块。
```js
import xml from '@ohos.xml';
import util from '@ohos.util'; // 需要使用util模块函数对文件编码
```
2. 对XML文件编码后调用XmlPullParser。
可以基于Arraybuffer构造XmlPullParser对象, 也可以基于DataView构造XmlPullParser对象。
```js
let strXml =
'' +
'' +
'Play' +
'Work' +
'';
let textEncoder = new util.TextEncoder();
let arrBuffer = textEncoder.encodeInto(strXml); // 对数据编码,防止包含中文字符乱码
// 1.基于Arraybuffer构造XmlPullParser对象
let that = new xml.XmlPullParser(arrBuffer.buffer, 'UTF-8');
// 2.基于DataView构造XmlPullParser对象
let dataView = new DataView(arrBuffer.buffer);
let that = new xml.XmlPullParser(dataView, 'UTF-8');
```
3. 自定义回调函数,本例直接打印出标签及标签值。
```js
let str = '';
function func(name, value){
str = name + value;
console.info(str);
return true; //true:继续解析 flase:停止解析
}
```
4. 设置解析选项,调用parse函数。
```js
let options = {supportDoctype:true, ignoreNameSpace:true, tagValueCallbackFunction:func};
that.parse(options);
```
输出结果如下所示:
```js
note
title
Play
title
lens
Work
lens
note
```
## 解析XML属性和属性值
1. 引入模块。
```js
import xml from '@ohos.xml';
import util from '@ohos.util'; // 需要使用util模块函数对文件编码
```
2. 对XML文件编码后调用XmlPullParser。
```js
let strXml =
'' +
'' +
' Play' +
' Happy' +
' Work' +
'';
let textEncoder = new util.TextEncoder();
let arrBuffer = textEncoder.encodeInto(strXml); // 对数据编码,防止包含中文字符乱码
let that = new xml.XmlPullParser(arrBuffer.buffer, 'UTF-8');
```
3. 自定义回调函数,本例直接打印出属性及属性值。
```js
let str = '';
function func(name, value){
str += name + ' ' + value + ' ';
return true; // true:继续解析 flase:停止解析
}
```
4. 设置解析选项,调用parse函数。
```js
let options = {supportDoctype:true, ignoreNameSpace:true, attributeValueCallbackFunction:func};
that.parse(options);
console.info(str); // 一次打印出所有的属性及其值
```
输出结果如下所示:
```js
importance high logged true // note节点的属性及属性值
```
## 解析XML事件类型和元素深度
1. 引入模块。
```js
import xml from '@ohos.xml';
import util from '@ohos.util'; // 需要使用util模块函数对文件编码
```
2. 对XML文件编码后调用XmlPullParser。
```js
let strXml =
'' +
'' +
'Play' +
'';
let textEncoder = new util.TextEncoder();
let arrBuffer = textEncoder.encodeInto(strXml); // 对数据编码,防止包含中文字符乱码
let that = new xml.XmlPullParser(arrBuffer.buffer, 'UTF-8');
```
3. 自定义回调函数,本例直接打印元素事件类型及元素深度。
```js
let str = '';
function func(name, value){
str = name + ' ' + value.getDepth(); // getDepth 获取元素的当前深度
console.info(str)
return true; //true:继续解析 flase:停止解析
}
```
4. 设置解析选项,调用parse函数。
```js
let options = {supportDoctype:true, ignoreNameSpace:true, tokenValueCallbackFunction:func};
that.parse(options);
```
输出结果如下所示:
```js
0 0 // 0: 对应事件类型START_DOCUMENT值为0 0:起始深度为0
2 1 // 2: 对应事件类型START_TAG值为2 1:深度为1
2 2 // 2:对应事件类型START_TAG值为2 2:深度为2
4 2 // 4:Play对应事件类型TEXT值为4 2:深度为2
3 2 // 3:对应事件类型END_TAG值为3 2:深度为2
3 1 // 3:对应事件类型END_TAG值为3 1:深度为1(与)
1 0 // 1:对应事件类型END_DOCUMENT值为1 0:深度为0
```
## 场景示例
此处以调用所有解析选项为例,提供解析XML标签、属性和事件类型的开发示例。
```js
import xml from '@ohos.xml';
import util from '@ohos.util';
let strXml =
'' +
'' +
'Everyday' +
'Giada' +
'';
let textEncoder = new util.TextEncoder();
let arrBuffer = textEncoder.encodeInto(strXml);
let that = new xml.XmlPullParser(arrBuffer.buffer, 'UTF-8');
let str = '';
function tagFunc(name, value) {
str = name + value;
console.info('tag-' + str);
return true;
}
function attFunc(name, value) {
str = name + ' ' + value;
console.info('attri-' + str);
return true;
}
function tokenFunc(name, value) {
str = name + ' ' + value.getDepth();
console.info('token-' + str);
return true;
}
let options = {
supportDocType: true,
ignoreNameSpace: true,
tagValueCallbackFunction: tagFunc,
attributeValueCallbackFunction: attFunc,
tokenValueCallbackFunction: tokenFunc
};
that.parse(options);
```
输出结果如下所示:
```js
tag-
token-0 0
tag-book
attri-category COOKING
token-2 1
tag-title
attri-lang en
token-2 2
tag-Everyday
token-4 2
tag-title
token-3 2
tag-author
token-2 2
tag-Giada
token-4 2
tag-author
token-3 2
tag-book
token-3 1
tag-
token-1 0
```