Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • Paddle-Lite
  • 合并请求
  • !1493

P
Paddle-Lite
  • 项目概览

PaddlePaddle / Paddle-Lite

通知 338
Star 4
Fork 1
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 271
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 78
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
P
Paddle-Lite
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 271
    • Issue 271
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 78
    • 合并请求 78
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板

支持attention模型、重构sgemm和depthwise conv3x3、实现winograd和depthwise conv5x5 v8版本 !1493

  • Report abuse
!1493 已关闭 3月 12, 2019 由 saxon_zh@saxon_zh 创建
#<User:0x00007f0e505eb310>
  • 概览 0
  • 提交 28
  • 变更 251

Created by: hjchen2

pr主要的工作如下: 1、支持ocr attention模型 2、修复Feed和Fetch op实现,支持多输入输出 3、重构float sgemm,并对数据打包做了优化,一般规模的矩阵乘gflops提升5%-10%。在ocr检测模型上加速40%左右 4、winograd arm64实现,ios平台ocr检测模型加速50% 5、重新实现depthwise conv3x3,解决原始版本在arm64下的bug,并在v8上会有较大的加速 6、depthwise conv5x5 arm64实现 7、优化op融合实现,保证融合后相比未融合预测速度更优

指派人
分配到
审核者
Request review from
无
里程碑
无
分配里程碑
工时统计
标识: paddlepaddle/Paddle-Lite!1493
Source branch: github/fork/hjchen2/backup
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7