experimental kernels for cuda

edcfa64d · Anatoly Baksheev · 50d1d711 · edcfa64d
隐藏空白更改
内联并排

Showing with 16 addition and 3 deletion

modules/gpu/src/opencv2/gpu/device/kernels.hpp modules/gpu/src/opencv2/gpu/device/kernels.hpp +16 -3

未找到文件。
--- a/modules/gpu/src/opencv2/gpu/device/kernels.hpp
+++ b/modules/gpu/src/opencv2/gpu/device/kernels.hpp
@@ -63,7 +63,7 @@ namespace cv

 			struct Warp
 			{
-				static __forceinline__ __device__ int STRIDE() { return warpSize;            
+				static __forceinline__ __device__ int STRIDE() { return warpSize };            
 				static __forceinline__ __device__ int SHIFT()  { return threadIdx.x & (warpSize - 1); }			
 			};

@@ -77,8 +77,8 @@ namespace cv
 	                out[idx] = in[idx];
 			}

-			template <class Worker, typename ForwardIterator, typename ForwardIterator>
-			__forceinline__ __device__ void Copy(ForwardIterator beg, ForwardIterator end, OutIter out)
+			template <class Worker, typename InIter, typename OutIter>
+			__forceinline__ __device__ void Copy(InIter beg, InIter end, OutIter out)
 			{
 				int STRIDE = Worker::STRIDE();
 				int SHIFT  = Worker::SHIFT();
@@ -103,6 +103,19 @@ namespace cv
 				for (; idx < length; idx += STRIDE, cur += STRIDE)
 					out[idx] = cur;				
 			}
+
+			template <class Worker, typename OutIter>
+			__forceinline__ __device__ void Yota(OutIter beg, OutIter end, int val)
+			{
+				int STRIDE = Worker::STRIDE();
+				int SHIFT  = Worker::SHIFT();
+
+				beg += SHIFT;
+				val += SHIFT;
+				
+				for (; beg < end; beg += STRIDE, val += STRIDE)
+					*beg = val;
+			}
 		}
 	}
 }