Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Greenplum
Opencv
提交
dfaa8af6
O
Opencv
项目概览
Greenplum
/
Opencv
11 个月 前同步成功
通知
7
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
O
Opencv
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
dfaa8af6
编写于
8月 08, 2011
作者:
V
Vladislav Vinogradov
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fixed #1279
上级
ed801d3e
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
17 addition
and
18 deletion
+17
-18
modules/gpu/src/cuda/surf.cu
modules/gpu/src/cuda/surf.cu
+0
-3
modules/gpu/src/opencv2/gpu/device/utility.hpp
modules/gpu/src/opencv2/gpu/device/utility.hpp
+13
-13
modules/gpu/test/test_main.cpp
modules/gpu/test/test_main.cpp
+4
-2
未找到文件。
modules/gpu/src/cuda/surf.cu
浏览文件 @
dfaa8af6
...
...
@@ -566,9 +566,6 @@ namespace cv { namespace gpu { namespace surf
float
*
s_sum_row
=
s_sum
+
threadIdx
.
y
*
32
;
//reduceSum32(s_sum_row, sumx);
//reduceSum32(s_sum_row, sumy);
warpReduce32
(
s_sum_row
,
sumx
,
threadIdx
.
x
,
plus
<
volatile
float
>
());
warpReduce32
(
s_sum_row
,
sumy
,
threadIdx
.
x
,
plus
<
volatile
float
>
());
...
...
modules/gpu/src/opencv2/gpu/device/utility.hpp
浏览文件 @
dfaa8af6
...
...
@@ -46,13 +46,13 @@
#include "internal_shared.hpp"
#include "saturate_cast.hpp"
#ifndef __CUDA_ARCH__
#define __CUDA_ARCH__ 0
#ifndef __CUDA_ARCH__
#define __CUDA_ARCH__ 0
#endif
#define OPENCV_GPU_LOG_WARP_SIZE (5)
#define OPENCV_GPU_WARP_SIZE (1 << OPENCV_GPU_LOG_WARP_SIZE)
#define OPENCV_GPU_LOG_MEM_BANKS ((__CUDA_ARCH__ >= 200) ? 5 : 4) // 32 banks on fermi, 16 on tesla
#define OPENCV_GPU_LOG_WARP_SIZE (5)
#define OPENCV_GPU_WARP_SIZE (1 << OPENCV_GPU_LOG_WARP_SIZE)
#define OPENCV_GPU_LOG_MEM_BANKS ((__CUDA_ARCH__ >= 200) ? 5 : 4) // 32 banks on fermi, 16 on tesla
#define OPENCV_GPU_MEM_BANKS (1 << OPENCV_GPU_LOG_MEM_BANKS)
#if defined(_WIN64) || defined(__LP64__)
...
...
@@ -65,15 +65,15 @@
namespace
cv
{
namespace
gpu
{
namespace
device
{
template
<
typename
T
>
void
__host__
__device__
__forceinline__
swap
(
T
&
a
,
T
&
b
)
{
T
temp
=
a
;
a
=
b
;
b
=
temp
;
template
<
typename
T
>
void
__host__
__device__
__forceinline__
swap
(
T
&
a
,
T
&
b
)
{
T
temp
=
a
;
a
=
b
;
b
=
temp
;
}
// warp-synchronous 32 elements reduction
template
<
typename
T
,
typename
Op
>
__device__
__forceinline__
void
warpReduce32
(
volatile
T
*
data
,
volatile
T
&
partial_reduction
,
int
tid
,
Op
op
)
template
<
typename
T
,
typename
Op
>
__device__
__forceinline__
void
warpReduce32
(
volatile
T
*
data
,
T
&
partial_reduction
,
int
tid
,
Op
op
)
{
data
[
tid
]
=
partial_reduction
;
...
...
@@ -88,7 +88,7 @@ namespace cv { namespace gpu { namespace device
}
// warp-synchronous 16 elements reduction
template
<
typename
T
,
typename
Op
>
__device__
__forceinline__
void
warpReduce16
(
volatile
T
*
data
,
volatile
T
&
partial_reduction
,
int
tid
,
Op
op
)
template
<
typename
T
,
typename
Op
>
__device__
__forceinline__
void
warpReduce16
(
volatile
T
*
data
,
T
&
partial_reduction
,
int
tid
,
Op
op
)
{
data
[
tid
]
=
partial_reduction
;
...
...
@@ -102,7 +102,7 @@ namespace cv { namespace gpu { namespace device
}
// warp-synchronous reduction
template
<
int
n
,
typename
T
,
typename
Op
>
__device__
__forceinline__
void
warpReduce
(
volatile
T
*
data
,
volatile
T
&
partial_reduction
,
int
tid
,
Op
op
)
template
<
int
n
,
typename
T
,
typename
Op
>
__device__
__forceinline__
void
warpReduce
(
volatile
T
*
data
,
T
&
partial_reduction
,
int
tid
,
Op
op
)
{
if
(
tid
<
n
)
data
[
tid
]
=
partial_reduction
;
...
...
modules/gpu/test/test_main.cpp
浏览文件 @
dfaa8af6
...
...
@@ -109,9 +109,11 @@ int main(int argc, char** argv)
cvtest
::
TS
::
ptr
()
->
init
(
"gpu"
);
testing
::
InitGoogleTest
(
&
argc
,
argv
);
//cv::CommandLineParser parser(argc, (const char**)argv)
;
const
char
*
keys
=
"{ nvtest_output_level | nvtest_output_level | none | NVidia test verbosity level }"
;
std
::
string
outputLevel
=
"none"
;
//parser.get<std::string>("nvtest_output_level", "none");
cv
::
CommandLineParser
parser
(
argc
,
(
const
char
**
)
argv
,
keys
);
std
::
string
outputLevel
=
parser
.
get
<
std
::
string
>
(
"nvtest_output_level"
,
"none"
);
if
(
outputLevel
==
"none"
)
nvidiaTestOutputLevel
=
OutputLevelNone
;
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录