PP-StructureV2_introduction.md 26.2 KB
Newer Older
littletomatodonkey's avatar
littletomatodonkey 已提交
# PP-StructureV2
littletomatodonkey's avatar
littletomatodonkey 已提交
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

##  目录

- [1. 背景](#1-背景)
- [2. 简介](#3-简介)
- [3. 整图方向矫正](#3-整图方向矫正)
- [4. 版面信息结构化](#4-版面信息结构化)
  - [4.1 版面分析](#41-版面分析)
  - [4.2 表格识别](#42-表格识别)
  - [4.3 版面恢复](#43-版面恢复)
- [5. 关键信息抽取](#5-关键信息抽取)
- [6. Reference](#6-Reference)

## 1. 背景


littletomatodonkey's avatar
littletomatodonkey 已提交
20 21 22

## 2. 简介

littletomatodonkey's avatar
littletomatodonkey 已提交
24 25 26

 * **系统功能升级** :新增图像矫正和版面复原模块,图像转word/pdf、关键信息抽取能力全覆盖!
 * **系统性能优化**
	 * 版面分析:发布轻量级版面分析模型,速度提升**11倍**,平均CPU耗时仅需**41ms**
littletomatodonkey's avatar
littletomatodonkey 已提交
28 29 30 31
	 * 表格识别:设计3大优化策略,预测耗时不变情况下,模型精度提升**6%**
	 * 关键信息抽取:设计视觉无关模型结构,语义实体识别精度提升**2.8%**,关系抽取精度提升**9.1%**
 * **中文场景适配** :完成对版面分析与表格识别的中文场景适配,开源**开箱即用**的中文场景版面结构化模型!

littletomatodonkey's avatar
littletomatodonkey 已提交
littletomatodonkey's avatar
littletomatodonkey 已提交
33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185939247-57e53254-399c-46c4-a610-da4fa79232f5.png" width="1200">


* 版面分析
	* PP-PicoDet:轻量级版面分析模型
	* FGD:兼顾全局与局部特征的模型蒸馏算法

* 表格识别
	* PP-LCNet:  CPU友好型轻量级骨干网络
	* CSP-PAN:轻量级高低层特征融合模块
	* SLAHead:结构与位置信息对齐的特征解码模块

* 关键信息抽取
	* VI-LayoutXLM:视觉特征无关的多模态预训练模型结构
	* TB-YX:考虑阅读顺序的文本行排序逻辑
	* UDML:联合互学习知识蒸馏策略

littletomatodonkey's avatar
littletomatodonkey 已提交

- 版面分析模型参数量减少95.6%,推理速度提升11倍,精度提升0.4%;
littletomatodonkey's avatar
littletomatodonkey 已提交
58 59 60 61 62 63 64
- 表格识别预测耗时不变,模型精度提升6%,端到端TEDS提升2%;
- 关键信息抽取模型速度提升2.8倍,语义实体识别模型精度提升2.8%;关系抽取模型精度提升9.1%。


## 3. 整图方向矫正

littletomatodonkey's avatar
littletomatodonkey 已提交
littletomatodonkey's avatar
littletomatodonkey 已提交
66 67 68 69 70 71 72 73 74 75 76


<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185939683-f6465473-3303-4a0c-95be-51f04fb9f387.png" width="600">

## 4. 版面信息结构化

### 4.1 版面分析

littletomatodonkey's avatar
littletomatodonkey 已提交

littletomatodonkey's avatar
littletomatodonkey 已提交
在PP-StructureV2中,我们发布基于PP-PicoDet的轻量级版面分析模型,并针对版面分析场景定制图像尺度,同时使用FGD知识蒸馏算法,进一步提升模型精度。最终CPU上`41ms`即可完成版面分析过程(仅包含模型推理时间,数据预处理耗时大约50ms左右)。在公开数据集PubLayNet 上,消融实验如下:
littletomatodonkey's avatar
littletomatodonkey 已提交
80 81 82

| 实验序号 | 策略                          | 模型存储(M) | mAP     | CPU预测耗时(ms) |
83 84 85 86 87
| 1    |  PP-YOLOv2(640*640)  |  221.0  | 93.60% |  512.00  |
| 2    | PP-PicoDet-LCNet2.5x(640*640) |  29.7 | 92.50% |53.20|
| 3    | PP-PicoDet-LCNet2.5x(800*608) |   29.7  | 94.20% |83.10 |
| 4    | PP-PicoDet-LCNet1.0x(800*608) |    9.7  | 93.50% | 41.20|
| 5    | PP-PicoDet-LCNet1.0x(800*608) + FGD |  9.7  | 94.00% |41.20|
littletomatodonkey's avatar
littletomatodonkey 已提交
88 89 90 91 92 93 94 95 96

* 测试条件
	* paddle版本:2.3.0
	* CPU:Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz,开启mkldnn,线程数为10


| 模型                | mAP | CPU预测耗时   |
97 98
| layoutparser (Detectron2)   | 88.98%    | 2.90s    |
| PP-StructureV2 (PP-PicoDet) | **94.00%**    |   41.20ms   |
littletomatodonkey's avatar
littletomatodonkey 已提交
99 100 101 102 103 104 105 106 107 108 109 110


<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185940305-2cd3633b-4c43-4f84-8a6f-5ce6a24e88ce.png" width="600">

#### 4.1.1 优化策略


littletomatodonkey's avatar
littletomatodonkey 已提交
112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132


FGD(Focal and Global Knowledge Distillation for Detectors),是一种兼顾局部全局特征信息的模型蒸馏方法,分为Focal蒸馏和Global蒸馏2个部分。Focal蒸馏分离图像的前景和背景,让学生模型分别关注教师模型的前景和背景部分特征的关键像素;Global蒸馏部分重建不同像素之间的关系并将其从教师转移到学生,以补偿Focal蒸馏中丢失的全局信息。我们基于FGD蒸馏策略,使用教师模型PP-PicoDet-LCNet2.5x(mAP=94.2%)蒸馏学生模型PP-PicoDet-LCNet1.0x(mAP=93.5%),可将学生模型精度提升0.5%,和教师模型仅差0.2%,而预测速度比教师模型快1倍。

#### 4.1.2 场景适配



<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185940445-92b7613f-e431-43c2-9033-3b3618ddae02.png" width="600">

在CDLA 数据集上,消融实验如下:

| 实验序号 | 策略             |  mAP     |
133 134 135 136
| 1    |  PP-YOLOv2 |  84.70% |
| 2    |  PP-PicoDet-LCNet2.5x(800*608) |  87.80% |
| 3    |  PP-PicoDet-LCNet1.0x(800*608) | 84.50% |
| 4    |  PP-PicoDet-LCNet1.0x(800*608) + FGD |  86.80% |
littletomatodonkey's avatar
littletomatodonkey 已提交
137 138 139 140 141 142 143 144 145 146




| 实验序号 | 策略            |  mAP     |
147 148 149 150
| 1    |  PP-YOLOv2  |91.30% |
| 2    |  PP-PicoDet-LCNet2.5x(800*608) |  95.90% |
| 3    |  PP-PicoDet-LCNet1.0x(800*608) |   95.20% |
| 4    |  PP-PicoDet-LCNet1.0x(800*608) + FGD |  95.70% |
littletomatodonkey's avatar
littletomatodonkey 已提交
151 152 153 154 155 156 157 158 159


<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185940654-956ef614-888a-4779-bf63-a6c2b61b97fa.png" width="600">

### 4.2 表格识别

基于深度学习的表格识别算法种类丰富,PP-StructureV1中,我们基于文本识别算法RARE研发了端到端表格识别算法TableRec-RARE,模型输出为表格结构的HTML表示,进而可以方便地转化为Excel文件。PP-StructureV2中,我们对模型结构和损失函数等5个方面进行升级,提出了 SLANet (Structure Location Alignment Network) ,模型结构如下图所示:
littletomatodonkey's avatar
littletomatodonkey 已提交
161 162 163 164 165 166 167 168 169 170 171 172

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185940811-089c9265-4be9-4776-b365-6d1125606b4b.png" width="1200">


|TableRec-RARE|	71.73% | 93.88% |779ms	|6.8M|
|+PP-LCNet|	74.71% |94.37%	|778ms|	8.7M|
|+CSP-PAN|	75.68%| 94.72%	|708ms|	9.3M|
|+SLAHead|	77.70%|94.85%|	766ms|	9.2M|
littletomatodonkey's avatar
littletomatodonkey 已提交
174 175 176 177 178 179 180 181 182 183
|+MergeToken|	76.31%|	95.89%|766ms|	9.2M|

* 测试环境
    * paddle版本:2.3.1
    * CPU:Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz,开启mkldnn,线程数为10


littletomatodonkey's avatar
littletomatodonkey 已提交
185 186 187 188 189 190 191
|TableRec-RARE|	71.73% | 93.88% |779ms	|6.8M|
|SLANet|76.31%|	95.89%|766ms|9.2M|

#### 4.2.1 优化策略

**(1) CPU友好型轻量级骨干网络PP-LCNet**

littletomatodonkey's avatar
littletomatodonkey 已提交
littletomatodonkey's avatar
littletomatodonkey 已提交
193 194 195 196 197 198 199 200 201


对骨干网络提取的特征进行融合,可以有效解决尺度变化较大等复杂场景中的模型预测问题。早期,FPN模块被提出并用于特征融合,但是它的特征融合过程仅包含单向(高->低),融合不够充分。CSP-PAN基于PAN进行改进,在保证特征融合更为充分的同时,使用CSP block、深度可分离卷积等策略减小了计算量。在表格识别场景中,我们进一步将CSP-PAN的通道数从128降低至96以降低模型大小。最终表格识别模型精度提升0.97%至75.68%,预测速度提升10%。


TableRec-RARE的TableAttentionHead如下图a所示,TableAttentionHead在执行完全部step的计算后拿到最终隐藏层状态表征(hiddens),随后hiddens经由SDM(Structure Decode Module)和CLDM(Cell Location Decode Module)模块生成全部的表格结构token和单元格坐标。但是这种设计忽略了单元格token和坐标之间一一对应的关系。

littletomatodonkey's avatar
littletomatodonkey 已提交
PP-StructureV2中,我们设计SLAHead模块,对单元格token和坐标之间做了对齐操作,如下图b所示。在SLAHead中,每一个step的隐藏层状态表征会分别送入SDM和CLDM来得到当前step的token和坐标,每个step的token和坐标输出分别进行concat得到表格的html表达和全部单元格的坐标。此外,考虑到表格识别模型的单元格准确率依赖于表格结构的识别准确,我们将损失函数中表格结构分支与单元格定位分支的权重比从1:1提升到8:1,并使用收敛更稳定的Smoothl1 Loss替换定位分支中的MSE Loss。最终模型精度从75.68%提高至77.7%。
littletomatodonkey's avatar
littletomatodonkey 已提交
203 204 205 206 207 208 209 210 211 212 213

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185940968-e3a2fbac-78d7-4b74-af54-a1dab860f470.png" width="1200">



littletomatodonkey's avatar
littletomatodonkey 已提交
littletomatodonkey's avatar
littletomatodonkey 已提交
215 216 217 218 219 220

#### 4.2.2 中文场景适配

littletomatodonkey's avatar
littletomatodonkey 已提交
222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251


<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185941221-c94e3d45-524c-4073-9644-21ba6a9fd93e.png" width="800">

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185941254-31f2b1fa-d594-4037-b1c7-0f24543e5d19.png" width="800">

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185941273-2f7131df-3fe7-43b8-9c64-77ad2cf3b947.png" width="800">

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185941295-d0672aa8-548d-4e6a-812c-ac5d5fd8a269.png" width="800">

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185941324-8036e959-abdc-4dc5-a9f2-730b07b4e3d3.png" width="800">

### 4.3 版面恢复

littletomatodonkey's avatar
littletomatodonkey 已提交
littletomatodonkey's avatar
littletomatodonkey 已提交
253 254 255 256 257 258 259 260

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185941816-4dabb3e8-a0db-4094-98ea-52e0a0fda8e8.png" width="1200">

## 5. 关键信息抽取

littletomatodonkey's avatar
littletomatodonkey 已提交
关键信息抽取指的是针对文档图像的文字内容,提取出用户关注的关键信息,如身份证中的姓名、住址等字段。PP-Structure中支持了基于多模态LayoutLM系列模型的语义实体识别 (Semantic Entity Recognition, SER) 以及关系抽取 (Relation Extraction, RE) 任务。PP-StructureV2中,我们对模型结构以及下游任务训练方法进行升级,提出了VI-LayoutXLM(Visual-feature Independent LayoutXLM),具体流程图如下所示。
littletomatodonkey's avatar
littletomatodonkey 已提交
262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185941978-abec7d4a-5e3a-4141-83f8-088d04ef898e.png" width="1000">


* VI-LayoutXLM:视觉特征无关的多模态预训练模型结构
* TB-YX:考虑人类阅读顺序的文本行排序逻辑
* UDML:联合互学习知识蒸馏策略


| 实验序号 | 策略                          | 模型大小(G) | 精度     | GPU预测耗时(ms) | CPU预测耗时(ms) |
| 1    | LayoutXLM          | 1.4     | 89.50% | 59.35       | 766.16      |
| 2    | VI-LayoutXLM | 1.1     | 90.46% | 23.71       | 675.58      |
| 3    | 实验2 + TB-YX文本行排序              | 1.1     | 92.50% | 23.71       | 675.58      |
littletomatodonkey's avatar
littletomatodonkey 已提交
282 283
| 4    | 实验3 + UDML蒸馏                | 1.1     | 93.19% | 23.71       | 675.58      |
| 5    | 实验3 + UDML蒸馏                | 1.1     | **93.19%** | **15.49**       | **675.58**      |
littletomatodonkey's avatar
littletomatodonkey 已提交
284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309

* 测试条件
	* paddle版本:2.3.0
	* GPU:V100,实验5的GPU预测耗时使用`trt+fp16`测试得到,环境为cuda10.2+ cudnn8.1.1 + trt7.2.3.4,其他实验的预测耗时统计中没有使用TRT。
	* CPU:Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz,开启mkldnn,线程数为10


| 模型                | SER Hmean | RE Hmean   |
| LayoutLMv2-base   | 85.44%    | 67.77%     |
| LayoutXLM-base    | 89.24%    | 70.73%     |
| StrucTexT-large   | 92.29%    | **86.81%** |
| VI-LayoutXLM-base (ours) | **93.19%**    | 83.92%     |

### 5.1 优化策略

**(1) VI-LayoutXLM(Visual-feature Independent LayoutXLM)**

LayoutLMv2以及LayoutXLM中引入视觉骨干网络,用于提取视觉特征,并与后续的text embedding进行联合,作为多模态的输入embedding。但是该模块为基于`ResNet_x101_64x4d`的特征提取网络,特征抽取阶段耗时严重,因此我们将其去除,同时仍然保留文本、位置以及布局等信息,最终发现针对LayoutXLM进行改进,下游SER任务精度无损,针对LayoutLMv2进行改进,下游SER任务精度仅降低`2.1%`,而模型大小减小了约`340M`。具体消融实验如下所示。

| 模型              | 模型大小 (G) | F-score | 精度收益   |
| LayoutLMv2      | 0.76     | 84.20%  | -      |
| VI-LayoutLMv2 | 0.42     | 82.10%  | -2.10% |
310 311
| LayoutXLM       | 1.40     | 89.50%  | -      |
| VI-LayouXLM   | 1.10      | 90.46%  | +0.96%  |
littletomatodonkey's avatar
littletomatodonkey 已提交
312 313 314


littletomatodonkey's avatar
fix doc  
littletomatodonkey 已提交
**(2) TB-YX排序方法(Threshold-Based YX sorting algorithm)**
littletomatodonkey's avatar
littletomatodonkey 已提交
316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396


def order_by_tbyx(ocr_info, th=20):
	ocr_info: a list of dict, which contains bbox information([x1, y1, x2, y2])
	th: threshold of the position threshold
    res = sorted(ocr_info, key=lambda r: (r["bbox"][1], r["bbox"][0])) # sort using y1 first and then x1
    for i in range(len(res) - 1):
        for j in range(i, 0, -1):
            # restore the order using the
            if abs(res[j + 1]["bbox"][1] - res[j]["bbox"][1]) < th and \
                    (res[j + 1]["bbox"][0] < res[j]["bbox"][0]):
                tmp = deepcopy(res[j])
                res[j] = deepcopy(res[j + 1])
                res[j + 1] = deepcopy(tmp)
    return res


<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185942080-9d4bafc9-fa7f-4da4-b139-b2bd703dc76d.png" width="800">


**(3) 互学习蒸馏策略**

UDML(Unified-Deep Mutual Learning)联合互学习是PP-OCRv2与PP-OCRv3中采用的对于文本识别非常有效的提升模型效果的策略。在训练时,引入2个完全相同的模型进行互学习,计算2个模型之间的互蒸馏损失函数(DML loss),同时对transformer中间层的输出结果计算距离损失函数(L2 loss)。使用该策略,最终XFUND数据集上,SER任务F1指标提升`0.6%`,RE任务F1指标提升`5.01%`


<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185942213-0909135b-3bcd-4d79-9e69-847dfb1c3b82.png" width="800">

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185942237-72923b42-8590-42eb-b687-fa819b1c3afd.png" width="800">


<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185942400-8920dc3c-de7f-46d0-b0bc-baca9536e0e1.png" width="800">

<div align="center">
    <img src="https://user-images.githubusercontent.com/14270174/185942416-ca4fd8b0-9227-4c65-b969-0afbda525b85.png" width="800">

### 5.2 更多场景消融实验


#### 5.2.1 XFUND_zh数据集


| 实验序号 | 策略                          | 模型大小(G) | F1-score |
| 1    | LayoutXLM          | 1.4     | 70.81%   |
| 2    | VI-LayoutXLM | 1.1     | 71.87%   |
| 3    | 实验2 + PP-OCR排序              | 1.1     | 78.91%   |
| 4    | 实验3 + UDML蒸馏                | 1.1     | **83.92%**   |

#### 5.2.2 FUNSD数据集


| 实验序号 | 策略                  | F1-score |
| 1    | LayoutXLM  | 82.28%   |
littletomatodonkey's avatar
littletomatodonkey 已提交
| 2    | PP-StructureV2 SER       | **87.79%**   |
littletomatodonkey's avatar
littletomatodonkey 已提交
398 399 400 401 402 403 404


| 实验序号 | 策略                 | F1-score |
| 1    | LayoutXLM    |  53.13%  |
littletomatodonkey's avatar
littletomatodonkey 已提交
| 2    | PP-StructureV2 SER    | **74.87%**   |
littletomatodonkey's avatar
littletomatodonkey 已提交
406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424

## 6. Reference
* [1] Zhong X, ShafieiBavani E, Jimeno Yepes A. Image-based table recognition: data, model, and evaluation[C]//European Conference on Computer Vision. Springer, Cham, 2020: 564-580.
* [2] Cui C, Gao T, Wei S. Yuning Du, Ruoyu Guo, Shuilong Dong, Bin Lu, Ying Zhou, Xueying Lv, Qiwen Liu, Xiaoguang Hu, Dianhai Yu, and Yanjun Ma* [J]. Pplcnet: A lightweight cpu convolutional neural network, 2021, 3.
* [3] Lin T Y, Dollár P, Girshick R, et al. Feature pyramid networks for object detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 2117-2125.
* [4] Yu G, Chang Q, Lv W, et al. PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices[J]. arXiv preprint arXiv:2111.00902, 2021.
* [5] Bochkovskiy A, Wang C Y, Liao H Y M. Yolov4: Optimal speed and accuracy of object detection[J]. arXiv preprint arXiv:2004.10934, 2020.
* [6] Ye J, Qi X, He Y, et al. PingAn-VCGroup's Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML[J]. arXiv preprint arXiv:2105.01848, 2021.
* [7] Zhong X, Tang J, Yepes A J. Publaynet: largest dataset ever for document layout analysis[C]//2019 International Conference on Document Analysis and Recognition (ICDAR). IEEE, 2019: 1015-1022.
* [8] CDLA:https://github.com/buptlihang/CDLA
* [9]Gao L, Huang Y, Déjean H, et al. ICDAR 2019 competition on table detection and recognition (cTDaR)[C]//2019 International Conference on Document Analysis and Recognition (ICDAR). IEEE, 2019: 1510-1515.
* [10] Mondal A, Lipps P, Jawahar C V. IIIT-AR-13K: a new dataset for graphical object detection in documents[C]//International Workshop on Document Analysis Systems. Springer, Cham, 2020: 216-230.
* [11] Tal ocr_tabel:https://ai.100tal.com/dataset
* [12] Li M, Cui L, Huang S, et al. Tablebank: A benchmark dataset for table detection and recognition[J]. arXiv preprint arXiv:1903.01949, 2019.
* [13]Li M, Xu Y, Cui L, et al. DocBank: A benchmark dataset for document layout analysis[J]. arXiv preprint arXiv:2006.01038, 2020.
* [14] Xu Y, Li M, Cui L, et al. Layoutlm: Pre-training of text and layout for document image understanding[C]//Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2020: 1192-1200.
* [15] Xu Y, Xu Y, Lv T, et al. LayoutLMv2: Multi-modal pre-training for visually-rich document understanding[J]. arXiv preprint arXiv:2012.14740, 2020.
* [16] Xu Y, Lv T, Cui L, et al. Layoutxlm: Multimodal pre-training for multilingual visually-rich document understanding[J]. arXiv preprint arXiv:2104.08836, 2021.
littletomatodonkey's avatar
add ref  
littletomatodonkey 已提交
425 426
* [17] Xu Y, Lv T, Cui L, et al. XFUND: A Benchmark Dataset for Multilingual Visually Rich Form Understanding[C]//Findings of the Association for Computational Linguistics: ACL 2022. 2022: 3214-3224.
* [18] Jaume G, Ekenel H K, Thiran J P. Funsd: A dataset for form understanding in noisy scanned documents[C]//2019 International Conference on Document Analysis and Recognition Workshops (ICDARW). IEEE, 2019, 2: 1-6.