Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
wux_labs
Tensorflow
提交
df1d9f90
T
Tensorflow
项目概览
wux_labs
/
Tensorflow
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
T
Tensorflow
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
df1d9f90
编写于
10月 13, 2022
作者:
T
TensorFlower Gardener
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #57979 from ROCmSoftwarePlatform:fixed_gpu_kernel_tiling_test_2
PiperOrigin-RevId: 480958124
上级
f7d6896e
46731284
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
18 addition
and
4 deletion
+18
-4
tensorflow/compiler/xla/service/gpu/tests/gpu_codegen_test.cc
...orflow/compiler/xla/service/gpu/tests/gpu_codegen_test.cc
+11
-2
tensorflow/compiler/xla/service/gpu/tests/gpu_kernel_tiling_test.cc
.../compiler/xla/service/gpu/tests/gpu_kernel_tiling_test.cc
+7
-2
未找到文件。
tensorflow/compiler/xla/service/gpu/tests/gpu_codegen_test.cc
浏览文件 @
df1d9f90
...
...
@@ -68,8 +68,17 @@ std::string GpuCodegenTest::MakePlatformSpecificLlvm(absl::string_view input) {
is_built_with_rocm_
?
"@llvm.amdgcn.s.barrier"
:
"@llvm.nvvm.barrier0"
},
{
"SHUFFLE"
,
is_built_with_rocm_
?
"i32 @llvm.amdgcn.ds.bpermute"
:
"float @llvm.nvvm.shfl.sync.down.f32"
},
{
"TIDX"
,
is_built_with_rocm_
?
"llvm.amdgcn.workitem.id.x"
:
"@llvm.nvvm.read.ptx.sreg.tid.x"
}});
{
"TIDX"
,
is_built_with_rocm_
?
"@llvm.amdgcn.workitem.id.x"
:
"@llvm.nvvm.read.ptx.sreg.tid.x"
},
{
"LCAL"
,
is_built_with_rocm_
?
"%[[LOGICAL_T1:.*]] = call { i1, i64 } "
"@llvm.amdgcn.if.i64(i1 %[[LOGICAL_T0]])"
:
"0"
},
{
"EXTV"
,
is_built_with_rocm_
?
"%[[LOGICAL_T2:.*]] = extractvalue { i1, i64 } %[[LOGICAL_T1]], 0"
:
"0"
},
{
"BR_CAL"
,
is_built_with_rocm_
?
"br i1 %[[LOGICAL_T2]],"
:
"br i1 %[[LOGICAL_T0]]"
}});
}
}
// namespace gpu
...
...
tensorflow/compiler/xla/service/gpu/tests/gpu_kernel_tiling_test.cc
浏览文件 @
df1d9f90
...
...
@@ -535,7 +535,9 @@ TEST_F(GpuKernelTilingTest, RowReductionTwoRowsPerWarp) {
; CHECK: %[[TID_LOGICAL:.*]] = and i32 %[[TID_X]], 15
; CHECK: call SHUFFLE
; CHECK: %[[LOGICAL_T0:.*]] = icmp eq i32 %[[TID_LOGICAL]], 0
; CHECK: br i1 %[[LOGICAL_T0]],
; CHECK: LCAL
; CHECK: EXTV
; CHECK: BR_CAL
)"
;
CompileAndVerifyIr
(
std
::
move
(
hlo_module
),
MakePlatformSpecificLlvm
(
expected_ir
),
...
...
@@ -572,8 +574,11 @@ TEST_F(GpuKernelTilingTest, RowReductionFourRowsPerWarp) {
; CHECK: %[[TID_LOGICAL:.*]] = and i32 %[[TID_X]], 7
; CHECK: call SHUFFLE
; CHECK: %[[LOGICAL_T0:.*]] = icmp eq i32 %[[TID_LOGICAL]], 0
; CHECK: br i1 %[[LOGICAL_T0]],
; CHECK: LCAL
; CHECK: EXTV
; CHECK: BR_CAL
)"
;
CompileAndVerifyIr
(
std
::
move
(
hlo_module
),
MakePlatformSpecificLlvm
(
expected_ir
),
/*match_optimized_ir=*/
true
);
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录