提交 feb4224d 编写于 作者: 文幕地方's avatar 文幕地方

update table_recognition.md

上级 d4a4c07c
...@@ -41,7 +41,7 @@ img_label ...@@ -41,7 +41,7 @@ img_label
'imgid': 0, # 图像的index 'imgid': 0, # 图像的index
'html': { 'html': {
'structure': {'tokens': ['<thead>', '<tr>', '<td>', ...]}, # 表格的HTML字符串 'structure': {'tokens': ['<thead>', '<tr>', '<td>', ...]}, # 表格的HTML字符串
'cell': [ 'cells': [
{ {
'tokens': ['P', 'a', 'd', 'd', 'l', 'e', 'P', 'a', 'd', 'd', 'l', 'e'], # 表格中的单个文本 'tokens': ['P', 'a', 'd', 'd', 'l', 'e', 'P', 'a', 'd', 'd', 'l', 'e'], # 表格中的单个文本
'bbox': [x0, y0, x1, y1] # 表格中的单个文本的坐标 'bbox': [x0, y0, x1, y1] # 表格中的单个文本的坐标
......
...@@ -41,7 +41,7 @@ The json format of each line is: ...@@ -41,7 +41,7 @@ The json format of each line is:
'imgid': 0,# index of image 'imgid': 0,# index of image
'html': { 'html': {
'structure': {'tokens': ['<thead>', '<tr>', '<td>', ...]}, # HTML string of the table 'structure': {'tokens': ['<thead>', '<tr>', '<td>', ...]}, # HTML string of the table
'cell': [ 'cells': [
{ {
'tokens': ['P', 'a', 'd', 'd', 'l', 'e', 'P', 'a', 'd', 'd', 'l', 'e'], # text in cell 'tokens': ['P', 'a', 'd', 'd', 'l', 'e', 'P', 'a', 'd', 'd', 'l', 'e'], # text in cell
'bbox': [x0, y0, x1, y1] # bbox of cell 'bbox': [x0, y0, x1, y1] # bbox of cell
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册