Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Xiaomi
Mace
提交
b3b71278
Mace
项目概览
Xiaomi
/
Mace
通知
106
Star
40
Fork
27
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
Mace
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
b3b71278
编写于
2月 24, 2018
作者:
L
liuqi
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update README.
上级
858b5c7f
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
30 addition
and
0 deletion
+30
-0
README.md
README.md
+30
-0
未找到文件。
README.md
浏览文件 @
b3b71278
# **MACE** - *Mobile(Mi) Accelerated Compute Engine Library*
---
小米自主研发的移动端神经网络加速引擎。
*可加入用户邮件组 mace-users@xiaomi.com*
## 简介
---
**利用端侧的异构计算设备加速神经网络模型。**
目前支持的端侧计算设备包括:
**CPU(NEON)/GPU/DSP**
.
## 架构
---
采用Op组成的有向无环图的计算模式,使用
**Tensor**
对象存储所有数据并进行统一管理。
## GPU
---
基于OpenCL 2.0实现,使用Image的存储格式优化内存访问和并行计算。
针对不同Op的算法,设计对应的Image存储格式来优化内存访问。
下面是针对不同
**Tensor**
类型对应的Buffer和Image的格式。
| Tensor类型 | Buffer格式 | Image格式 | 说明 |
| --------- | :---------:|:--------:|:----:|
|Channel-Major Input/Output | NHWC | [W
* (C+3)/4, N *
H] | 默认输入输出的格式|
|Height-Major Input/Output | NHWC | [W
* C, N *
(H+3)/4] | Winograd Convolution所用格式|
|Width-Major Input/Output | NHWC | [(W+3)/4
* C, N *
H] | Winograd Convolution所用格式|
|Convolution Filter | HWOI | [H
* W *
RoundUp
<
4
>
(I), (O+3)/4]|卷积核格式,尝试过[H
*w*
I, (O+3)/4],两者性能没有区别|
|Depthwise Convlution Filter | HWIM | [H
* W *
M, (I+3)/4]|Depthwise卷积核格式|
|1-D Argument | W | [(W+3)/4, 1] | 一维参数格式,如Bias|
\ No newline at end of file
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录