installation.md 4.1 KB
Newer Older
L
LDOUBLEV 已提交
1
## 快速安装
2

L
LDOUBLEV 已提交
3 4
经测试PaddleOCR可在glibc 2.23上运行,您也可以测试其他glibc版本或安装glic 2.23
PaddleOCR 工作环境
T
tink2123 已提交
5
- PaddlePaddle 1.7+
D
dyning 已提交
6
- python3.7
L
LDOUBLEV 已提交
7
- glibc 2.23
T
tink2123 已提交
8
- cuDNN 7.6+ (GPU)
L
LDOUBLEV 已提交
9

D
dyning 已提交
10
建议使用我们提供的docker运行PaddleOCR,有关docker、nvidia-docker使用请参考[链接](https://docs.docker.com/get-started/)
L
LDOUBLEV 已提交
11

T
tink2123 已提交
12 13
*如您希望使用 mac 或 windows直接运行预测代码,可以从第2步开始执行。*

L
LDOUBLEV 已提交
14
1. (建议)准备docker环境。第一次使用这个镜像,会自动下载该镜像,请耐心等待。
15 16 17
```
# 切换到工作目录下
cd /home/Projects
L
LDOUBLEV 已提交
18
# 首次运行需创建一个docker容器,再次运行时不需要运行当前命令
D
dyning 已提交
19 20
# 创建一个名字为ppocr的docker容器,并将当前目录映射到容器的/paddle目录下

21 22 23
如果您希望在CPU环境下使用docker,使用docker而不是nvidia-docker创建docker
sudo docker run --name ppocr -v $PWD:/paddle --network=host -it hub.baidubce.com/paddlepaddle/paddle:latest-gpu-cuda9.0-cudnn7-dev /bin/bash

D
dyning 已提交
24 25 26 27 28 29 30
如果您的机器安装的是CUDA9,请运行以下命令创建容器
sudo nvidia-docker run --name ppocr -v $PWD:/paddle --network=host -it hub.baidubce.com/paddlepaddle/paddle:latest-gpu-cuda9.0-cudnn7-dev /bin/bash

如果您的机器安装的是CUDA10,请运行以下命令创建容器
sudo nvidia-docker run --name ppocr -v $PWD:/paddle --network=host -it hub.baidubce.com/paddlepaddle/paddle:latest-gpu-cuda10.0-cudnn7-dev /bin/bash

您也可以访问[DockerHub](https://hub.docker.com/r/paddlepaddle/paddle/tags/)获取与您机器适配的镜像。
L
LDOUBLEV 已提交
31 32

# ctrl+P+Q可退出docker,重新进入docker使用如下命令
33
sudo docker container exec -it ppocr /bin/bash
D
dyning 已提交
34 35
```

L
LDOUBLEV 已提交
36 37 38 39 40 41 42 43 44 45 46 47 48 49
注意:如果docker pull过慢,可以按照如下步骤手动下载后加载docker,以cuda9 docker为例,使用cuda10 docker只需要将cuda9改为cuda10即可。
```
# 下载CUDA9 docker的压缩文件,并解压
wget https://paddleocr.bj.bcebos.com/docker/docker_pdocr_cuda9.tar.gz
# 为减少下载时间,上传的docker image是压缩过的,需要解压使用
tar zxf docker_pdocr_cuda9.tar.gz
# 创建image
docker load < docker_pdocr_cuda9.tar
# 完成上述步骤后通过docker images检查是否加载了下载的镜像
docker images
# 执行docker images后如果有下面的输出,即可按照按照 步骤1 创建docker环境。
hub.baidubce.com/paddlepaddle/paddle   latest-gpu-cuda9.0-cudnn7-dev    f56310dcc829
```

D
dyning 已提交
50 51 52 53 54 55 56 57 58 59 60 61 62 63 64
2. 更改python3默认版本

docker中的python默认使用python3.5,PaddleOCR需要在Python3.7下执行(该版本下,对于第三方依赖库的兼容性更好一些)。进入docker后,可以编辑`/etc/profile`文件,之后在文件末尾添加

```shell
alias python=python3.7
alias pip=pip3.7

alias python3=python3.7
alias pip3=pip3.7
```

保存之后,使用`source /etc/profile`命令使设置的默认Python生效。

3. 安装PaddlePaddle Fluid v1.7
D
dyning 已提交
65 66 67 68 69
```
pip3 install --upgrade pip

如果您的机器安装的是CUDA9,请运行以下命令安装
python3 -m pip install paddlepaddle-gpu==1.7.2.post97 -i https://pypi.tuna.tsinghua.edu.cn/simple
L
LDOUBLEV 已提交
70

D
dyning 已提交
71 72 73
如果您的机器安装的是CUDA10,请运行以下命令安装
python3 -m pip install paddlepaddle-gpu==1.7.2.post107 -i https://pypi.tuna.tsinghua.edu.cn/simple

T
tink2123 已提交
74 75
如果您的机器是CPU,请运行以下命令安装

T
tink2123 已提交
76
python3 -m pip install paddlepaddle==1.7.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
T
tink2123 已提交
77

D
dyning 已提交
78
更多的版本需求,请参照[安装文档](https://www.paddlepaddle.org.cn/install/quick)中的说明进行操作。
79 80
```

D
dyning 已提交
81
4. 克隆PaddleOCR repo代码
82
```
D
dyning 已提交
83 84 85 86 87 88
【推荐】git clone https://github.com/PaddlePaddle/PaddleOCR

如果因为网络问题无法pull成功,也可选择使用码云上的托管:

git clone https://gitee.com/paddlepaddle/PaddleOCR

D
dyning 已提交
89
注:码云托管代码可能无法实时同步本github项目更新,存在3~5天延时,请优先使用推荐方式。
90 91
```

D
dyning 已提交
92
5. 安装第三方库
93 94
```
cd PaddleOCR
D
dyning 已提交
95
pip3 install -r requirments.txt
96
```
L
LDOUBLEV 已提交
97 98 99

注意,windows环境下,建议从[这里](https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely)下载shapely安装包完成安装,
直接通过pip安装的shapely库可能出现`[winRrror 126] 找不到指定模块的问题`