Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • Paddle
  • Issue
  • #2826

P
Paddle
  • 项目概览

PaddlePaddle / Paddle
大约 2 年 前同步成功

通知 2325
Star 20933
Fork 5424
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 1423
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 543
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
P
Paddle
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 1,423
    • Issue 1,423
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 543
    • 合并请求 543
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板
已关闭
开放中
Opened 7月 12, 2017 by saxon_zh@saxon_zhGuest

The need of cpu acceleartion implementation of depthwise convolution in Mobilenet.

Created by: NHZlX

Depthwise Convolution

background

  1. Now, people widely use the mobilenet for it's small model size(~12M for 1.0 mobilenet) and good preformance on many tasks(classification, detection etc), and just like it‘s name, it‘s widely used in Embedded system.

  2. PaddlePaddle is working on supporting the embedded system,therefore, mobilenet on paddle is indispensable

  3. Mobilenet mainly contains two operations: depthwise convolution and pointwise convolution. Pointwise convolution, that is, 1*1 convolution with groups equals 1, depthwise convolution is a specific convolution with groups equals the input channels. The optimization of mobilenet is basically the optimization of depthwise conv.

  4. Although one can build depthwise convolution with ExpandConvLayer in paddle, but it's very slow, especially training process. The Gpu acceleration of mobilenet on paddle have been already realized, this will speed up the mobilenet training process https://github.com/PaddlePaddle/Paddle/pull/2776

Need to do

  1. im2col operation are not necessary in 1 * 1 convolution.
  2. The need of cpu acceleration implementation of depthwise convolution. For ARM, neon acceleartion is also needed.
  3. Fuse batch normalization on paddle.
指派人
分配到
无
里程碑
无
分配里程碑
工时统计
无
截止日期
无
标识: paddlepaddle/Paddle#2826
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7