Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • Paddle-Lite
  • 合并请求
  • !4180

P
Paddle-Lite
  • 项目概览

PaddlePaddle / Paddle-Lite

通知 338
Star 4
Fork 1
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 271
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 78
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
P
Paddle-Lite
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 271
    • Issue 271
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 78
    • 合并请求 78
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板

[KERNEL][OPENCL] Fix concat; Enable conv3x3 with group !4180

  • Report abuse
!4180 已合并 8月 21, 2020 由 saxon_zh@saxon_zh 创建
#<User:0x00007fed4dd6bce8>
  • 概览 25
  • 提交 13
  • 变更 10

Created by: ysh329

状态:等待review

主要内容

  1. opencl concat:
    1. 增加支持opencl concat的3inputs、4inputs的情况。其中,将paddle-mobile的部分实现迁入,并对其内的kernel实现变量名修正和优化;
    2. 修正buffer opencl concat实现的一处类型转换问题;
    3. image concat增加通用情况,即从opencl img的数据格式转换为buffer,以concat_buffer来做计算,最后再转换回来;
  2. 默认开启带group的conv3x3。之前默认因性能缘故没有打开,开启后当group>1时,才会执行;
  3. 整理./lite/kernels/opencl下的CMake文件中部分target的命令。先前buffer和image的实现,名字有重叠,现在以image和buffer后缀加以区别;
  4. 修改hard sigmoid的兼容性bug: 部分gpu不支持矢量和标量的乘法,所以改为kernel内标量scale强转(CL_DTYPE4)再做计算;
  5. 修复其它小问题。略;
指派人
分配到
审核者
Request review from
无
里程碑
无
分配里程碑
工时统计
标识: paddlepaddle/Paddle-Lite!4180
Source branch: github/fork/ysh329/fix-concat
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7