Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
机器未来
Paddle
提交
97549a4f
P
Paddle
项目概览
机器未来
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
97549a4f
编写于
7月 17, 2019
作者:
Y
Yihua Xu
提交者:
tensor-tang
7月 17, 2019
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
[CPU] Fix the compiling issue with AVX512F macro. (#18634)
上级
256ba7cb
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
6 addition
and
7 deletion
+6
-7
paddle/fluid/operators/jit/more/intrinsic/crf_decoding.cc
paddle/fluid/operators/jit/more/intrinsic/crf_decoding.cc
+6
-7
未找到文件。
paddle/fluid/operators/jit/more/intrinsic/crf_decoding.cc
浏览文件 @
97549a4f
...
@@ -46,7 +46,7 @@ void CRFDecoding(const int seq_len, const float* x, const float* w,
...
@@ -46,7 +46,7 @@ void CRFDecoding(const int seq_len, const float* x, const float* w,
x_content
=
_mm512_loadu_ps
(
x
+
i_offset
);
x_content
=
_mm512_loadu_ps
(
x
+
i_offset
);
alpha_content
=
_mm512_add_ps
(
w_content
,
x_content
);
alpha_content
=
_mm512_add_ps
(
w_content
,
x_content
);
// Save the alpha value.
// Save the alpha value.
_mm512_storeu_ps
(
alpha
_value
+
i_offset
,
alpha_content
);
_mm512_storeu_ps
(
alpha
+
i_offset
,
alpha_content
);
#else
#else
// AVX or AVX2
// AVX or AVX2
// weights, input and alpha values.
// weights, input and alpha values.
...
@@ -131,12 +131,11 @@ void CRFDecoding(const int seq_len, const float* x, const float* w,
...
@@ -131,12 +131,11 @@ void CRFDecoding(const int seq_len, const float* x, const float* w,
}
}
/* Update the alpha and track values. */
/* Update the alpha and track values. */
#ifdef __AVX512F__
#ifdef __AVX512F__
__m512
x_content
=
__m512
x_content
=
_mm512_loadu_ps
(
x
+
seq_offset
+
tag_num
+
j_offset
);
_mm512_loadu_ps
(
x
+
seq_offset
+
this
->
num_
+
j_offset
);
max_score
=
_mm512_add_ps
(
max_score
,
x_content
);
max_score
=
_mm512_add_ps
(
max_score
,
x_content
);
_mm512_storeu_ps
(
alpha
+
seq_offset
+
t
his
->
num_
+
j_offset
,
max_score
);
_mm512_storeu_ps
(
alpha
+
seq_offset
+
t
ag_num
+
j_offset
,
max_score
);
_mm512_storeu_si512
(
reinterpret_cast
<
__m512i
*>
(
track
+
seq_offset
+
_mm512_storeu_si512
(
this
->
num_
+
j_offset
),
reinterpret_cast
<
__m512i
*>
(
track
+
seq_offset
+
tag_num
+
j_offset
),
max_j
);
max_j
);
#else
#else
__m256
x_content
=
_mm256_loadu_ps
(
x
+
seq_offset
+
tag_num
+
j_offset
);
__m256
x_content
=
_mm256_loadu_ps
(
x
+
seq_offset
+
tag_num
+
j_offset
);
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录