Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • Paddle
  • Issue
  • #5629

P
Paddle
  • 项目概览

PaddlePaddle / Paddle
大约 2 年 前同步成功

通知 2325
Star 20933
Fork 5424
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 1423
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 543
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
P
Paddle
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 1,423
    • Issue 1,423
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 543
    • 合并请求 543
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板
已关闭
开放中
Opened 11月 14, 2017 by saxon_zh@saxon_zhGuest

配置gpu运行book例子的02.recognize_digits,报错CUDA error: invalid device function

Created by: shiyazhou121

问题描述: 按照【AI学习】PaddlePaddle深度学习实战-PaddlePaddle在不同平台的安装 (http://learn.baidu.com/pages/index.html#/courseInfo/13655?courseId=13655&_k=usdv7x)中centos 6.3环境安装gpu版paddle方法。首先安装python27-gcc482,然后按照视频中方法配置gpu。 下面是配置的cudnn和cuda的环境变量 LD_LIBRARY_PATH=/usr/local/cuda/lib64:/home/work/cudnn/cudnn_v5/cuda/lib64:/usr/local/ganglia/lib64:/usr/local/apr/lib:/usr/local/cuda/lib64:/usr/local/cuda/lib:/usr/local/ganglia/lib64:/usr/local/apr/lib:/usr/local/cuda/lib64:/usr/local/cuda/lib::/home/work/cuda-8.0/lib64:/home/work/cuda-8.0/lib:/home/HGCP_Program/software-install/hadoop-v2/hadoop/lib:/home/HGCP_Program/software-install/hadoop-v2/hadoop/libhce:/home/HGCP_Program/software-install/hadoop-v2/hadoop/libhdfs:/home/HGCP_Program/software-install/openmpi-1.8.5/lib:/home/work/cuda-8.0/lib64:/home/work/cuda-8.0/lib:/home/HGCP_Program/software-install/hadoop-v2/hadoop/lib:/home/HGCP_Program/software-install/hadoop-v2/hadoop/libhce:/home/HGCP_Program/software-install/hadoop-v2/hadoop/libhdfs:/home/HGCP_Program/software-install/openmpi-1.8.5/lib

配置完成后,尝试运行book中的02.recognize_digits时报错,下面是全部日志

I1114 14:56:59.516850 4275 Util.cpp:166] commandline: --use_gpu=1 --trainer_count=1 W1114 14:57:08.683694 4275 CpuId.h:112] PaddlePaddle wasn't compiled to use avx instructions, but these are available on your machine and could speed up CPU computations via CMAKE .. -DWITH_AVX=ON [INFO 2017-11-14 14:57:08,688 layers.py:2539] output for __conv_pool_0___conv: c = 20, h = 24, w = 24, size = 11520 [INFO 2017-11-14 14:57:08,689 layers.py:2667] output for __conv_pool_0___pool: c = 20, h = 12, w = 12, size = 2880 [INFO 2017-11-14 14:57:08,690 layers.py:2539] output for __conv_pool_1___conv: c = 50, h = 8, w = 8, size = 3200 [INFO 2017-11-14 14:57:08,691 layers.py:2667] output for __conv_pool_1___pool: c = 50, h = 4, w = 4, size = 800 F1114 14:57:08.697180 4275 hl_gpu_matrix_kernel.cuh:181] Check failed: cudaSuccess == err (0 vs. 8) [hl_gpu_apply_unary_op failed] CUDA error: invalid device function *** Check failure stack trace: *** @ 0x7fe360c605ed google::LogMessage::Fail() @ 0x7fe360c6409c google::LogMessage::SendToLog() @ 0x7fe360c600e3 google::LogMessage::Flush() @ 0x7fe360c655ae google::LogMessageFatal::~LogMessageFatal() @ 0x7fe360aeaec4 hl_gpu_apply_unary_op<>() @ 0x7fe360aeb205 paddle::BaseMatrixT<>::applyUnary<>() @ 0x7fe360aeb433 paddle::BaseMatrixT<>::zero() @ 0x7fe3609868d1 paddle::Parameter::enableType() @ 0x7fe3609821cc paddle::parameterInitNN() @ 0x7fe36098491a paddle::NeuralNetwork::init() @ 0x7fe3609ad491 paddle::GradientMachine::create() @ 0x7fe360c3d3b3 GradientMachine::createFromPaddleModelPtr() @ 0x7fe360c3d58f GradientMachine::createByConfigProtoStr() @ 0x7fe36084c4cd _wrap_GradientMachine_createByConfigProtoStr @ 0x4b4cb9 PyEval_EvalFrameEx @ 0x4b6b28 PyEval_EvalCodeEx @ 0x4b5d10 PyEval_EvalFrameEx @ 0x4b6b28 PyEval_EvalCodeEx @ 0x4b5d10 PyEval_EvalFrameEx @ 0x4b6b28 PyEval_EvalCodeEx @ 0x52940f function_call @ 0x422cba PyObject_Call @ 0x4271ad instancemethod_call @ 0x422cba PyObject_Call @ 0x48121f slot_tp_init @ 0x47eb1a type_call @ 0x422cba PyObject_Call @ 0x4b31dd PyEval_EvalFrameEx @ 0x4b6b28 PyEval_EvalCodeEx @ 0x4b5d10 PyEval_EvalFrameEx @ 0x4b6b28 PyEval_EvalCodeEx @ 0x4b6c52 PyEval_EvalCode Aborted

之后尝试其他book例子,发现全部是这个报错,这个是什么原因?怎么解决?

指派人
分配到
无
里程碑
无
分配里程碑
工时统计
无
截止日期
无
标识: paddlepaddle/Paddle#5629
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7