Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MegEngine 天元
MegEngine
提交
c7a99098
MegEngine
项目概览
MegEngine 天元
/
MegEngine
1 年多 前同步成功
通知
403
Star
4705
Fork
582
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
MegEngine
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
提交
c7a99098
编写于
7月 21, 2022
作者:
M
Megvii Engine Team
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
feat(cuda): add int4 ptx 256x64 mma kernel
GitOrigin-RevId: 8f7475b0f6f60c13f7cc8e571c81822d72b6f689
上级
cf3ca1e9
变更
3
展开全部
显示空白变更内容
内联
并排
Showing
3 changed file
with
1666 addition
and
0 deletion
+1666
-0
dnn/src/cuda/ptx/uint4_int4/fuse_z_imma8832_ldg16_256x64_relu.cu
.../cuda/ptx/uint4_int4/fuse_z_imma8832_ldg16_256x64_relu.cu
+828
-0
dnn/src/cuda/ptx/uint4_int4/imma8832_256x64.cuh
dnn/src/cuda/ptx/uint4_int4/imma8832_256x64.cuh
+25
-0
dnn/src/cuda/ptx/uint4_int4/imma8832_ldg16_256x64_relu.cu
dnn/src/cuda/ptx/uint4_int4/imma8832_ldg16_256x64_relu.cu
+813
-0
未找到文件。
dnn/src/cuda/ptx/uint4_int4/fuse_z_imma8832_ldg16_256x64_relu.cu
0 → 100644
浏览文件 @
c7a99098
此差异已折叠。
点击以展开。
dnn/src/cuda/ptx/uint4_int4/imma8832_256x64.cuh
0 → 100644
浏览文件 @
c7a99098
#pragma once
#include "./base.cuh"
#define TX 128
#define TY 1
#define BM 64
#define BN 256
#define BK 128
#define mma_m 16
#define mma_n 8
#define mma_k 64
#define reg_m 8
#define reg_n 8
#define packed_channel 64
#define BKd32 (BK / 32)
#define reg_md4 (reg_m >> 2)
#define WARPS (TX / 32)
#define cache_per_warp 128
#define reg_nd4 (reg_n >> 2)
#define ldg_src (BN * BK / (16 * TX))
#define ldg_filter (BM * BK / (16 * TX))
#define ldg_width 16
// vim: syntax=cpp.doxygen
dnn/src/cuda/ptx/uint4_int4/imma8832_ldg16_256x64_relu.cu
0 → 100644
浏览文件 @
c7a99098
此差异已折叠。
点击以展开。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录