编译安装与单元测试 ¶

Contents

编译安装与单元测试

1. 运行Docker GPU镜像出现 “CUDA driver version is insufficient”¶

用户在使用PaddlePaddle GPU的Docker镜像的时候，常常出现 Cuda Error: CUDA driver version is insufficient for CUDA runtime version, 原因在于没有把机器上CUDA相关的驱动和库映射到容器内部。具体的解决方法是：

$ export CUDA_SO="$(\ls usr/lib64/libcuda* | xargs -I{} echo '-v {}:{}') $(\ls /usr/lib64/libnvidia* | xargs -I{} echo '-v {}:{}')"
$ export DEVICES=$(\ls /dev/nvidia* | xargs -I{} echo '--device {}:{}')
$ docker run ${CUDA_SO} ${DEVICES} -it paddlepaddle/paddle:latest-gpu

更多关于Docker的安装与使用, 请参考 PaddlePaddle Docker 文档。

2. CMake源码编译, 找到的PythonLibs和PythonInterp版本不一致 ¶

这是目前CMake寻找Python的逻辑存在缺陷，如果系统安装了多个Python版本，CMake找到的Python库和Python解释器版本可能有不一致现象，导致编译PaddlePaddle失败。正确的解决方法是，用户强制指定特定的Python版本，具体操作如下：

cmake .. -DPYTHON_EXECUTABLE=<exc_path> -DPYTHON_LIBRARY=<lib_path>  -DPYTHON_INCLUDE_DIR=<inc_path>

用户需要指定本机上Python的路径：<exc_path>, <lib_path>, <inc_path>

3. CMake源码编译，Paddle版本号为0.0.0 ¶

如果运行 paddle version, 出现 PaddlePaddle 0.0.0；或者运行 cmake ..，出现

CMake Warning at cmake/version.cmake:20 (message):
  Cannot add paddle version from git tag

那么用户需要拉取所有的远程分支到本机，命令为 git fetch upstream，然后重新cmake即可。

4. paddlepaddle*.whl is not a supported wheel on this platform.¶

出现这个问题的主要原因是，没有找到和当前系统匹配的paddlepaddle安装包。最新的paddlepaddle python安装包支持Linux x86_64和MacOS 10.12操作系统，并安装了python 2.7和pip 9.0.1。

更新 pip 包的方法是:

pip install --upgrade pip

如果还不行，可以执行 python -c "import pip; print(pip.pep425tags.get_supported())" 获取当前系统支持的python包的后缀，并对比是否和正在安装的后缀一致。

如果系统支持的是 linux_x86_64 而安装包是 manylinux1_x86_64 ，需要升级pip版本到最新；如果系统支持 manylinux1_x86_64 而安装包（本地）是 linux_x86_64 ，可以重命名这个whl包为 manylinux1_x86_64 再安装。

5. 编译安装后执行 import paddle.v2 as paddle 报ImportError: No module named v2 ¶

先查看一下是否曾经安装过paddle v1版本，有的话需要先卸载：

pip uninstall py_paddle paddle

然后安装paddle的python环境, 在build目录下执行

pip install python/dist/paddle*.whl && pip install ../paddle/dist/py_paddle*.whl

6. 遇到“非法指令”或者是“illegal instruction”¶

PaddlePaddle使用avx SIMD指令提高cpu执行效率，因此错误的使用二进制发行版可能会导致这种错误，请选择正确的版本。

7. python相关的单元测试都过不了 ¶

如果出现以下python相关的单元测试都过不了的情况：

- test_PyDataProvider (Failed)
- test_RecurrentGradientMachine (Failed)
- test_NetworkCompare (Failed)
- test_PyDataProvider2 (Failed)
- test_Prediction (Failed)
- test_Compare (Failed)
- test_Trainer (Failed)
- test_TrainerOnePass (Failed)
- test_CompareTwoNets (Failed)
- test_CompareTwoOpts (Failed)
- test_CompareSparse (Failed)
- test_recurrent_machine_generation (Failed)
- test_PyDataProviderWrapper (Failed)
- test_config_parser (Failed)
- test_swig_api (Failed)
- layers_test (Failed)

并且查询PaddlePaddle单元测试的日志，提示：

paddle package is already in your PYTHONPATH. But unittest need a clean environment.
Please uninstall paddle package before start unittest. Try to 'pip uninstall paddle'.

解决办法是：

卸载PaddlePaddle包 pip uninstall paddle, 清理掉老旧的PaddlePaddle安装包，使得单元测试有一个干净的环境。如果PaddlePaddle包已经在python的site-packages里面，单元测试会引用site-packages里面的python包，而不是源码目录里 /python 目录下的python包。同时，即便设置 PYTHONPATH 到 /python 也没用，因为python的搜索路径是优先已经安装的python包。

8. 下载MKLML库失败 ¶

make[2]: *** [third_party/mklml/src/extern_mklml-stamp/extern_mklml-download] 错误 4
make[1]: *** [CMakeFiles/extern_mklml.dir/all] 错误 2
make[1]: *** 正在等待未完成的任务....

原因：网速或SSL链接原因，导致MKLML库下载不成功。

解决办法是：手动下载并安装，具体步骤如下。

// 1. 进入对应的目录
cd build/third_party/mklml/src/extern_mklml

// 2. 查看包的大小， 正常情况下是75M，如果小于75M，即下载失败：
du -sh mklml_lnx_2018.0.1.20171007.tgz

// 3. 手动下载且解压缩，并手动生成download成功标签：
wget --no-check-certificate https://github.com/01org/mkl-dnn/releases/download/v0.11/mklml_lnx_2018.0.1.20171007.tgz -c -O mklml_lnx_2018.0.1.20171007.tgz
tar zxf mklml_lnx_2018.0.1.20171007.tgz
touch ../extern_mklml-stamp/extern_mklml-download

// 4. 接着编译即可