安装PaddlePaddle的Docker镜像¶

PaddlePaddle提供了Docker的使用镜像。PaddlePaddle推荐使用Docker进行Paddle的部署和运行。Docker是一个基于容器的轻量级虚拟环境。具有和宿主机差不多的运行效率，并提供了非常方便的二进制分发手段。

下述内容将分为如下几个类别描述。

PaddlePaddle提供的Docker镜像版本
下载和运行Docker镜像
注意事项

PaddlePaddle提供的Docker镜像版本¶

我们提供了6个Docker image:

paddledev/paddlepaddle:latest-cpu: Paddle的CPU二进制
paddledev/paddlepaddle:latest-gpu： Paddle的GPU二进制
paddledev/paddlepaddle:latest-cpu-devel: Paddle的CPU二进制,同时包含CPU开发环境和源码
paddledev/paddlepaddle:latest-gpu-devel: Paddle的GPU二进制,同时包含GPU开发环境和源码
paddledev/paddlepaddle:latest-cpu-demo: Paddle的CPU二进制,同时包含CPU开发环境、源码和运行demo的必要依赖
paddledev/paddlepaddle:latest-gpu-demo: Paddle的GPU二进制,同时包含GPU开发环境、源码和运行demo的必要依赖

同时，不同的稳定版本，会将latest替换成稳定版本的版本号。

Paddle提供的镜像并不包含任何命令运行，想要运行Paddle，您需要进入镜像运行paddle 程序或者自定义一个含有启动脚本的image。具体请参考注意事项中的使用ssh访问paddle镜像

下载和运行Docker镜像¶

为了运行PaddlePaddle的docker镜像，您需要在机器中安装好Docker。安装Docker需要您的机器至少具有3.10以上的linux kernel。安装方法请参考 Docker的官方文档。如果您使用 mac osx或者是windows机器，请参考 mac osx的安装文档和 windows 的安装文档。

您可以使用 docker pull 命令预先下载镜像，也可以直接执行 docker run 命令运行镜像。执行方法如下:

$ docker run -it paddledev/paddlepaddle:latest-cpu

即可启动和进入PaddlePaddle的container。如果运行GPU版本的PaddlePaddle，则需要先将 cuda相关的Driver和设备映射进container中，脚本类似于

$ export CUDA_SO="$(\ls /usr/lib64/libcuda* | xargs -I{} echo '-v {}:{}') $(\ls /usr/lib64/libnvidia* | xargs -I{} echo '-v {}:{}')"
$ export DEVICES=$(\ls /dev/nvidia* | xargs -I{} echo '--device {}:{}')
$ docker run -it paddledev/paddlepaddle:latest-gpu

进入Docker container后，运行 paddle version 即可打印出paddle的版本和构建信息。安装完成的paddle主体包括三个部分， paddle 脚本， python的 :code:`paddle`包和:code:`py_paddle`包。其中:

:code:`paddle`脚本和:code:`paddle`的python包是paddle的训练主要程序。使用 :code:`paddle`脚本可以启动paddle的训练进程和pserver。而:code:`paddle`脚本中的二进制使用了:code:`paddle`的python包来做配置文件解析等工作。
python包:code:`py_paddle`是一个swig封装的paddle包，用来做预测和简单的定制化训练。

注意事项¶

性能问题¶

由于Docker是基于容器的轻量化虚拟方案，所以在CPU的运算性能上并不会有严重的影响。而GPU的驱动和设备全部映射到了容器内，所以GPU在运算性能上也不会有严重的影响。

但是如果使用了高性能的网卡，例如RDMA网卡(RoCE 40GbE 或者 IB 56GbE)，或者高性能的以太网卡 (10GbE)。推荐使用将本地网卡，即 “–net=host” 来进行训练。而不使用docker 的网桥来进行网络通信。

远程访问问题和二次开发¶

由于Paddle的Docker镜像并不包含任何预定义的运行命令。所以如果想要在后台启用ssh 远程访问，则需要进行一定的二次开发，将ssh装入系统内并开启远程访问。二次开发可以使用Dockerfile构建一个全新的docker image。需要参考 Dockerfile的文档和 Dockerfile的最佳实践两个文档。

简单的含有ssh的Dockerfile如下：

FROM paddledev/paddlepaddle

MAINTAINER PaddlePaddle dev team <paddle-dev@baidu.com>

RUN apt-get update
RUN apt-get install -y openssh-server
RUN mkdir /var/run/sshd
RUN echo 'root:root' | chpasswd

RUN sed -ri 's/^PermitRootLogin\s+.*/PermitRootLogin yes/' /etc/ssh/sshd_config
RUN sed -ri 's/UsePAM yes/#UsePAM yes/g' /etc/ssh/sshd_config

EXPOSE 22

CMD    ["/usr/sbin/sshd", "-D"]

使用该Dockerfile构建出镜像，然后运行这个container即可。相关命令为:

# cd到含有Dockerfile的路径中
$ docker build . -t paddle_ssh
# 运行这个container，将宿主机的8022端口映射到container的22端口上
$ docker run -d -p 8022:22  --name paddle_ssh_machine paddle_ssh

执行如下命令即可以关闭这个container，并且删除container中的数据:

# 关闭container
$ docker stop paddle_ssh_machine
# 删除container
$ docker rm paddle_ssh_machine

如果想要在外部机器访问这个container，即可以使用ssh访问宿主机的8022端口。用户名为 root，密码也是root。命令为:

$ ssh -p 8022 root@YOUR_HOST_MACHINE

至此，您就可以远程的使用PaddlePaddle啦。

安装PaddlePaddle的Docker镜像¶

PaddlePaddle提供的Docker镜像版本¶

下载和运行Docker镜像¶

注意事项¶

性能问题¶

远程访问问题和二次开发¶

Table Of Contents

Previous topic

Next topic

This Page