# 环境准备 --- ## 目录 - [1. 手动配置PaddlePaddle, PaddleClas环境](#1) - [1.1 安装 PaddlePaddle](#1.1) - [1.1.1 使用Paddle官方镜像](#1.1.1) - [1.1.2 在现有环境中安装paddle](#1.1.2) - [1.1.3 安装验证](#1.1.3) - [1.2 克隆 PaddleClas](#1.2) - [1.3 安装 Python 依赖库](#1.3) - [2. 快速创建PaddlePaddle, PaddleClas环境](#2) 我们提供了两种配置PaddlePaddle、PaddleClas环境的方法,第一种需要基于 docker 手动配置,您可以根据提供的命令更灵活的配置您的环境,详情请见[1. 手动配置PaddlePaddle, PaddleClas环境](#1)。第二种方式是我们将 PaddlePaddle、PaddleClas 相关的环境已配置到一个 docker 镜像中,您可以直接拉取使用,详情请见[2. 快速创建PaddlePaddle, PaddleClas环境](#2)。 ## 1. 手动配置PaddlePaddle, PaddleClas环境 ### 1.1 安装PaddlePaddle 目前,**PaddleClas** 要求 **PaddlePaddle** 版本 `>=2.3`。 建议使用Paddle官方提供的 Docker 镜像运行 PaddleClas,有关 Docker、nvidia-docker 的相关使用教程可以参考[链接](https://www.runoob.com/Docker/Docker-tutorial.html)。 #### 1.1.1 使用Paddle官方镜像 * 切换到工作目录下,例如工作目录为`/home/Projects`,则运行命令: ```shell cd /home/Projects ``` * 创建 docker 容器 下述命令会创建一个名为 ppcls 的 Docker 容器,并将当前工作目录映射到容器内的 `/paddle` 目录。 ```shell # 对于 GPU 用户 sudo nvidia-docker run --name ppcls -v $PWD:/paddle --shm-size=8G --network=host -it registry.baidubce.com/paddlepaddle/paddle:2.3.0-gpu-cuda10.2-cudnn7 /bin/bash # 对于 CPU 用户 sudo docker run --name ppcls -v $PWD:/paddle --shm-size=8G --network=host -it paddlepaddle/paddle:2.3.0-gpu-cuda10.2-cudnn7 /bin/bash ``` **注意**: * 首次使用该镜像时,下述命令会自动下载该镜像文件,下载需要一定的时间,请耐心等待; * 上述命令会创建一个名为 ppcls 的 Docker 容器,之后再次使用该容器时无需再次运行该命令; * 参数 `--shm-size=8G` 将设置容器的共享内存为 8 G,如机器环境允许,建议将该参数设置较大,如 `64G`; * 您也可以访问 [DockerHub](https://hub.Docker.com/r/paddlepaddle/paddle/tags/) ,手动选择需要的镜像; * 退出/进入 docker 容器: * 在进入 Docker 容器后,可使用组合键 `Ctrl + P + Q` 退出当前容器,同时不关闭该容器; * 如需再次进入容器,可使用下述命令: ```shell sudo Docker exec -it ppcls /bin/bash ``` #### 1.1.2 在现有环境中安装paddle 您也可以用pip或conda直接安装paddle,详情请参考官方文档中的[快速安装](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/docker/linux-docker.html)部分。 #### 1.1.3 安装验证 使用以下命令可以验证 PaddlePaddle 是否安装成功。 ```python import paddle paddle.utils.run_check() ``` 查看 PaddlePaddle 版本的命令如下: ```bash python -c "import paddle; print(paddle.__version__)" ``` **注意**: - 从源码编译的 PaddlePaddle 版本号为 `0.0.0`,请确保使用 PaddlePaddle 2.3 及之后的源码进行编译; - PaddleClas 基于 PaddlePaddle 高性能的分布式训练能力,若您从源码编译,请确保打开编译选项 `WITH_DISTRIBUTE=ON`。具体编译选项参考 [编译选项表](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/install/Tables.html#bianyixuanxiangbiao); - 在 Docker 中运行时,为保证 Docker 容器有足够的共享内存用于 Paddle 的数据读取加速,在创建 Docker 容器时,请设置参数 `--shm-size=8g`,条件允许的话可以设置为更大的值。 ### 1.2 克隆 PaddleClas 从 GitHub 下载: ```shell git clone https://github.com/PaddlePaddle/PaddleClas.git -b develop ``` 如果访问 GitHub 网速较慢,可以从 Gitee 下载,命令如下: ```shell git clone https://gitee.com/paddlepaddle/PaddleClas.git -b develop ``` ### 1.3 安装 PaddleClas 及其 Python 依赖库 * **[建议]** 直接安装 PaddleClas: ```shell pip install paddleclas ``` * 如需使用 PaddleClas develop 分支体验最新功能,或是需要基于 PaddleClas 进行二次开发,请本地构建安装,命令如下: ```shell python setup.py install ``` ## 2. 快速创建PaddlePaddle, PaddleClas环境 我们也提供了包含最新 PaddleClas 代码的 docker 镜像,并预先安装好了所有的环境和库依赖,您只需要**拉取并运行docker镜像**,无需其他任何额外操作,即可开始享用 PaddleClas 的所有功能。 在[Docker Hub](https://hub.docker.com/repository/docker/paddlecloud/paddleclas)中获取这些镜像及相应的使用指南,包括CPU、GPU、ROCm 版本。 如果您对自动化制作docker镜像感兴趣,或有自定义需求,请访问[PaddlePaddle/PaddleCloud](https://github.com/PaddlePaddle/PaddleCloud/tree/main/tekton)做进一步了解。 **备注**:当前的镜像中的 PaddleClas 代码默认使用最新的 release/2.4 分支。