Reduce time variation for cuda_managed_memory_test (#42458)

c89d6518 · Ruibiao Chen · GitHub · d90e24ac · c89d6518
显示空白变更内容
内联并排

Showing with 3 addition and 3 deletion

paddle/fluid/memory/cuda_managed_memory_test.cu paddle/fluid/memory/cuda_managed_memory_test.cu +3 -3

未找到文件。
--- a/paddle/fluid/memory/cuda_managed_memory_test.cu
+++ b/paddle/fluid/memory/cuda_managed_memory_test.cu
@@ -107,7 +107,7 @@ TEST(ManagedMemoryTest, OversubscribeGPUMemoryTest) {
  uint64_t available_mem = platform::GpuAvailableMemToAlloc();
  uint64_t n_data = available_mem * 2 / sizeof(int) +
                    1;  // requires more than 2 * available_mem bytes
-  uint64_t step = 1024;
+  uint64_t step = std::max(n_data / 1024, static_cast<uint64_t>(1));
  AllocationPtr data_allocation =
      Alloc(platform::CUDAPlace(0), n_data * sizeof(int));
  AllocationPtr sum_allocation = Alloc(platform::CUDAPlace(0), sizeof(int));
@@ -115,8 +115,8 @@ TEST(ManagedMemoryTest, OversubscribeGPUMemoryTest) {
  int* sum = static_cast<int*>(sum_allocation->ptr());
  (*sum) = 0;
-  write_kernel<<<5120, 1024>>>(data, n_data, step);
+  write_kernel<<<1, 1024>>>(data, n_data, step);
-  sum_kernel<<<5120, 1024>>>(data, n_data, step, sum);
+  sum_kernel<<<1, 1024>>>(data, n_data, step, sum);
 #ifdef PADDLE_WITH_CUDA
  PADDLE_ENFORCE_GPU_SUCCESS(cudaDeviceSynchronize());