Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
机器未来
Paddle
提交
b4897600
P
Paddle
项目概览
机器未来
/
Paddle
与 Fork 源项目一致
Fork自
PaddlePaddle / Paddle
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
1
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Paddle
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
1
Issue
1
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
b4897600
编写于
10月 30, 2019
作者:
W
Wilber
提交者:
GitHub
10月 30, 2019
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix jit_matmul bug test=develop (#20886)
* fix jit_matmul bug * update jit matmul and add test
上级
3255fe69
变更
2
显示空白变更内容
内联
并排
Showing
2 changed file
with
8 addition
and
2 deletion
+8
-2
paddle/fluid/operators/jit/gen/matmul.cc
paddle/fluid/operators/jit/gen/matmul.cc
+7
-1
python/paddle/fluid/tests/unittests/test_fusion_repeated_fc_relu_op.py
.../fluid/tests/unittests/test_fusion_repeated_fc_relu_op.py
+1
-1
未找到文件。
paddle/fluid/operators/jit/gen/matmul.cc
浏览文件 @
b4897600
...
...
@@ -40,7 +40,12 @@ void MatMulJitCode::genCode() {
size_t
wgt_offset
=
0
;
for
(
size_t
g
=
0
;
g
<
groups
.
size
();
++
g
)
{
size_t
x_offset
=
0
;
size_t
wgt_offset_tmp
=
0
;
for
(
int
i
=
0
;
i
<
g
;
++
i
)
{
wgt_offset_tmp
+=
groups
[
i
]
*
block_len
;
}
for
(
int
k
=
0
;
k
<
k_
;
++
k
)
{
wgt_offset
=
wgt_offset_tmp
;
vbroadcastss
(
zmm_t
(
x_reg_idx
),
ptr
[
param_x
+
x_offset
]);
// clean
if
(
k
==
0
)
{
...
...
@@ -49,7 +54,8 @@ void MatMulJitCode::genCode() {
}
}
for
(
int
i
=
0
;
i
<
groups
[
g
];
++
i
)
{
vmovups
(
zmm_t
(
w_reg_idx
),
ptr
[
reg_ptr_wgt
+
wgt_offset
]);
vmovups
(
zmm_t
(
w_reg_idx
),
ptr
[
reg_ptr_wgt
+
wgt_offset
+
k
*
n_
*
sizeof
(
float
)]);
vfmadd231ps
(
zmm_t
(
i
),
zmm_t
(
w_reg_idx
),
zmm_t
(
x_reg_idx
));
wgt_offset
+=
block_len
;
}
...
...
python/paddle/fluid/tests/unittests/test_fusion_repeated_fc_relu_op.py
浏览文件 @
b4897600
...
...
@@ -78,7 +78,7 @@ class TestFusionRepeatedFCReluOp(OpTest):
class
TestFusionRepeatedFCReluOpBS1
(
TestFusionRepeatedFCReluOp
):
def
set_conf
(
self
):
self
.
bs
=
1
self
.
oc
=
[
4
,
2
,
7
,
5
]
self
.
oc
=
[
4
,
2
,
7
,
5
,
512
,
1024
]
if
__name__
==
'__main__'
:
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录