未验证 提交 2ce8304c 编写于 作者: T Tink_Y 提交者: GitHub

Update LoD-Tensor.md

上级 d5d59713
......@@ -110,7 +110,7 @@ Fluid引入了一个索引数据结构(LoD)来将张量分割成序列。
## LoD-Tensor
一个LoD-Tensor可以被看作是一个树的结构,树叶是基本的序列元素,树枝作为基本元素的标识。
在 Fluid 中 LoD-Tensor 的序列信息有两种表述形式:原始长度和偏移量。由于偏移量的思想不那么容易被用户接受,为方便用户理解,我们将这个实现细节封装在c++中,并在Python API中以原始长度表示LoD-Tensor。并将原始长度称为:`recursive_sequence_lengths`
在 Fluid 中 LoD-Tensor 的序列信息有两种表述形式:原始长度和偏移量。在 Paddle 内部采取偏移量的形式表述 LoD-Tensor,以获得更快的序列访问速度;在 python API中采取原始长度表示 LoD-Tensor 方便用户理解和计算。在 python 中将原始长度称为:`recursive_sequence_lengths`
以上文提到的一个2-level LoD-Tensor为例:
```
......@@ -118,7 +118,7 @@ Fluid引入了一个索引数据结构(LoD)来将张量分割成序列。
3 2 4 1 2 3
||| || |||| | || |||
```
用原始长度表达此Lod-Tensor:recursive_sequence_lengths=[ [3,2,1] , [3,2,4,1,2,3] ]。
以偏移量表示此 LoD-Tensor:[ [0,3,4,6] , [0,3,5,9,10,12,15] ],用原始长度表达此Lod-Tensor:recursive_sequence_lengths=[ [3(3-0),1(4-3),2(6-4)] , [3(3-0),2(5-3),4(9-5),1(10-9),2(12-10),3(15-12)] ]。
以文字序列为例: [3,1,2] 可以表示这个mini-batch中有3篇文章,每篇文章分别有3、2、1个句子,[3,2,4,1,2,3] 表示每个句子中分别含有3、2、4、1、2、3个字。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册