# PaddleStructure ## 1. pipeline介绍 PaddleStructure 是一个用于复杂板式文字OCR的工具包,流程如下 ![pipeline](../doc/table/pipeline.png) 在PaddleStructure中,图片会先经由layoutparser进行版面分析,在版面分析中,会对图片里的区域进行分类,根据根据类别进行对于的ocr流程。 目前layoutparser会输出五个类别: 1. Text 2. Title 3. Figure 4. List 5. Table 1-4类走传统的OCR流程,5走表格的OCR流程。 ## 2. LayoutParser [文档](layout/README.md) ## 3. Table OCR [文档](table/README_ch.md) ## 4. PaddleStructure whl包介绍 ### 4.1 使用 4.1.1 代码使用 ```python import cv2 from paddlestructure import PaddleStructure,draw_result table_engine = PaddleStructure( output='./output/table', show_log=True) img_path = '../doc/table/1.png' img = cv2.imread(img_path) result = table_engine(img) for line in result: print(line) from PIL import Image font_path = 'path/tp/PaddleOCR/doc/fonts/simfang.ttf' image = Image.open(img_path).convert('RGB') im_show = draw_result(image, result,font_path=font_path) im_show = Image.fromarray(im_show) im_show.save('result.jpg') ``` 4.1.2 命令行使用 ```bash paddlestructure --image_dir=../doc/table/1.png ``` ### 参数说明 大部分参数和paddleocr whl包保持一致,见 [whl包文档](../doc/doc_ch/whl.md) | 字段 | 说明 | 默认值 | |------------------------|------------------------------------------------------|------------------| | output | excel和识别结果保存的地址 | ./output/table | | structure_max_len | structure模型预测时,图像的长边resize尺度 | 488 | | structure_model_dir | structure inference 模型地址 | None | | structure_char_type | structure 模型所用字典地址 | ../ppocr/utils/dict/table_structure_dict.tx |