Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • Paddle-Lite
  • 合并请求
  • !4236

P
Paddle-Lite
  • 项目概览

PaddlePaddle / Paddle-Lite

通知 338
Star 4
Fork 1
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 271
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 78
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
P
Paddle-Lite
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 271
    • Issue 271
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 78
    • 合并请求 78
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板

[BugFix][KERNEL][OPENCL] Fix conv3x3 group. test=develop !4236

  • Report abuse
!4236 已合并 9月 01, 2020 由 saxon_zh@saxon_zh 创建
#<User:0x00007fedf0677a60>
  • 概览 6
  • 提交 3
  • 变更 1

Created by: ysh329

状态:等待review

主要内容

  1. 修复conv3x3 group在oppo骁龙625上结果写入失败(总是0),某三星手机重启问题;
  2. conv3x3 group小地方优化。if-else换为三元操作符等,整个图像修复模型,有略微性能提升60000->55000(625),8000->7000(865),大概10%左右;
  3. 冗余代码移除,group=1。

简单分析

cl kernel里有一个half4 input[9]; 这么个变量,在大部分手机上都没问题,就那两个手机(oppo骁龙625和三星某手机)分别出现结果写入到这个input[9]的某个分量里如input[3].x写入失败(oppo骁龙625),和重启(三星)。

经 @zhaoyang-star 的建议,尝试把这个half4 input[9],改为half4 input0,input1....定义9个,就不会出现这个上面的问题了。我猜想是不是这种half4 input[9]定义的方式超出了手机gpu的设置,导致的写入失败。当然,感觉这个问题的内存本质,我感觉还可以再深入探究下。

指派人
分配到
审核者
Request review from
无
里程碑
无
分配里程碑
工时统计
标识: paddlepaddle/Paddle-Lite!4236
Source branch: github/fork/ysh329/fix-conv3x3-group
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7