Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Xiaomi
Mace
提交
cdb2da6f
Mace
项目概览
Xiaomi
/
Mace
通知
106
Star
40
Fork
27
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
Mace
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
cdb2da6f
编写于
5月 21, 2018
作者:
李
李寅
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Improve Softmax perf
上级
dbbf8596
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
26 addition
and
34 deletion
+26
-34
mace/kernels/softmax.h
mace/kernels/softmax.h
+26
-34
未找到文件。
mace/kernels/softmax.h
浏览文件 @
cdb2da6f
...
...
@@ -43,6 +43,7 @@ struct SoftmaxFunctor<DeviceType::CPU, float> {
const
index_t
batch
=
input
->
dim
(
0
);
const
index_t
class_count
=
input
->
dim
(
1
);
const
index_t
class_size
=
input
->
dim
(
2
)
*
input
->
dim
(
3
);
const
index_t
batch_size
=
class_count
*
class_size
;
Tensor
::
MappingGuard
input_guard
(
input
);
Tensor
::
MappingGuard
output_guard
(
output
);
...
...
@@ -50,46 +51,37 @@ struct SoftmaxFunctor<DeviceType::CPU, float> {
float
*
output_data
=
output
->
mutable_data
<
float
>
();
for
(
index_t
b
=
0
;
b
<
batch
;
++
b
)
{
std
::
vector
<
float
>
max_val
(
class_size
,
std
::
numeric_limits
<
float
>::
lowest
());
std
::
vector
<
float
>
sum_val
(
class_size
,
0.
f
);
// calculate max for each class
for
(
index_t
c
=
0
;
c
<
class_count
;
++
c
)
{
const
float
*
input_ptr
=
input_data
+
(
b
*
class_count
+
c
)
*
class_size
;
for
(
index_t
k
=
0
;
k
<
class_size
;
++
k
)
{
max_val
[
k
]
=
std
::
max
(
max_val
[
k
],
input_ptr
[
k
]);
}
}
// calculate data - max for each class
#pragma omp parallel for
for
(
index_t
c
=
0
;
c
<
class_count
;
++
c
)
{
const
float
*
input_ptr
=
input_data
+
(
b
*
class_count
+
c
)
*
class_size
;
float
*
output_ptr
=
output_data
+
(
b
*
class_count
+
c
)
*
class_size
;
for
(
index_t
k
=
0
;
k
<
class_size
;
++
k
)
{
output_ptr
[
k
]
=
::
exp
(
input_ptr
[
k
]
-
max_val
[
k
]);
for
(
index_t
k
=
0
;
k
<
class_size
;
++
k
)
{
const
float
*
input_ptr
=
input_data
+
b
*
batch_size
+
k
;
float
*
output_ptr
=
output_data
+
b
*
batch_size
+
k
;
float
max_val
=
std
::
numeric_limits
<
float
>::
lowest
();
index_t
channel_offset
=
0
;
for
(
index_t
c
=
0
;
c
<
class_count
;
++
c
)
{
float
data
=
input_ptr
[
channel_offset
];
if
(
data
>
max_val
)
{
max_val
=
data
;
}
channel_offset
+=
class_size
;
}
}
// calculate sum for each class
for
(
index_t
c
=
0
;
c
<
class_count
;
++
c
)
{
float
*
output_ptr
=
output_data
+
(
b
*
class_count
+
c
)
*
class_size
;
for
(
index_t
k
=
0
;
k
<
class_size
;
++
k
)
{
sum_val
[
k
]
+=
output_ptr
[
k
];
channel_offset
=
0
;
float
sum
=
0
;
for
(
index_t
c
=
0
;
c
<
class_count
;
++
c
)
{
float
exp_value
=
::
exp
(
input_ptr
[
channel_offset
]
-
max_val
);
sum
+=
exp_value
;
output_ptr
[
channel_offset
]
=
exp_value
;
channel_offset
+=
class_size
;
}
}
// calculate (data - max) / sum for each class
for
(
index_t
c
=
0
;
c
<
class_count
;
++
c
)
{
float
*
output_ptr
=
output_data
+
(
b
*
class_count
+
c
)
*
class_size
;
for
(
index_t
k
=
0
;
k
<
class_size
;
++
k
)
{
output_ptr
[
k
]
/=
sum_val
[
k
];
channel_offset
=
0
;
for
(
index_t
c
=
0
;
c
<
class_count
;
++
c
)
{
output_ptr
[
channel_offset
]
/=
sum
;
channel_offset
+=
class_size
;
}
}
}
}
// k
}
// b
}
};
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录