Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
BaiXuePrincess
Paddle
提交
c8e12587
P
Paddle
项目概览
BaiXuePrincess
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
c8e12587
编写于
9月 27, 2019
作者:
L
Li Fuchen
提交者:
GitHub
9月 27, 2019
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Fixed warpctc, test=develop (#20011)
Use AllocateTmpTensor() for creating temporary tensors in warpctc.
上级
63dd3183
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
8 addition
and
5 deletion
+8
-5
paddle/fluid/operators/warpctc_op.h
paddle/fluid/operators/warpctc_op.h
+8
-5
未找到文件。
paddle/fluid/operators/warpctc_op.h
浏览文件 @
c8e12587
...
...
@@ -73,11 +73,12 @@ class WarpCTCFunctor {
"Bytes of workspace got by warp-ctc function, "
"get_workspace_size(), should be larger than 0."
);
Tensor
workspace
;
auto
&
dev_ctx
=
ctx
.
template
device_context
<
DeviceContext
>()
;
size_t
workspace_elements
=
workspace_bytes
/
sizeof
(
float
)
+
1UL
;
float
*
workspace_data
=
workspace
.
mutable_data
<
floa
t
>
(
Tensor
workspace
=
ctx
.
AllocateTmpTensor
<
float
,
DeviceContex
t
>
(
framework
::
make_ddim
({
static_cast
<
int64_t
>
(
workspace_elements
)}),
ctx
.
GetPlace
());
dev_ctx
);
float
*
workspace_data
=
workspace
.
data
<
float
>
();
math
::
SetConstant
<
DeviceContext
,
float
>
()(
ctx
.
template
device_context
<
DeviceContext
>(),
&
workspace
,
static_cast
<
float
>
(
0
));
...
...
@@ -186,8 +187,10 @@ class WarpCTCKernel : public framework::OpKernel<T> {
framework
::
make_ddim
({
static_cast
<
int64_t
>
(
max_sequence_length
),
static_cast
<
int64_t
>
(
num_sequences
),
static_cast
<
int64_t
>
(
sequence_width
)});
warpctc_logits
.
mutable_data
<
T
>
(
warpctc_logits_dims
,
ctx
.
GetPlace
());
auto
&
dev_ctx
=
ctx
.
template
device_context
<
DeviceContext
>();
Tensor
warpctc_logits_tmp
=
ctx
.
AllocateTmpTensor
<
T
,
DeviceContext
>
(
warpctc_logits_dims
,
dev_ctx
);
warpctc_logits
.
ShareDataWith
(
warpctc_logits_tmp
);
if
(
ctx
.
HasInput
(
"LogitsLength"
))
{
TensorCopySync
(
*
logits
,
ctx
.
GetPlace
(),
&
warpctc_logits
);
}
else
{
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录