提交 6109810a 编写于 作者: T tink2123

update doc for multi-lang

上级 a07ed72f
# 多语言模型 # 多语言模型
近期更新: **近期更新**
* 支持**80种**语言的检测和识别 - 2021.4.9 支持**80种**语言的检测和识别
* 支持**轻量高精度**英文模型检测识别 - 2021.4.9 支持**轻量高精度**英文模型检测识别
* 优化英文模型中的空格识别
- [1 安装](#安装) - [1 安装](#安装)
- [1.1 paddle 安装](#paddle安装) - [1.1 paddle 安装](#paddle安装)
...@@ -19,10 +18,12 @@ ...@@ -19,10 +18,12 @@
- [2.2.1 整图预测](#python_检测+识别) - [2.2.1 整图预测](#python_检测+识别)
- [2.2.2 识别预测](#python_识别) - [2.2.2 识别预测](#python_识别)
- [2.2.3 检测预测](#python_检测) - [2.2.3 检测预测](#python_检测)
- [3 支持语种及缩写](#支持语种及缩写) - [3 支持语种及缩写](#语种缩写)
<a name="安装"></a>
## 1 安装 ## 1 安装
<a name="paddle安装"></a>
### 1.1 paddle 安装 ### 1.1 paddle 安装
``` ```
# cpu # cpu
...@@ -31,20 +32,25 @@ pip install paddlepaddle ...@@ -31,20 +32,25 @@ pip install paddlepaddle
# gpu # gpu
pip instll paddlepaddle-gpu pip instll paddlepaddle-gpu
``` ```
<a name="paddleocr_package_安装"></a>
### 1.2 paddleocr package 安装 ### 1.2 paddleocr package 安装
pip 安装 pip 安装
``` ```
pip install "paddleocr>=2.0.3" # 推荐使用2.0.3版本 pip install "paddleocr>=2.0.4" # 推荐使用2.0.4版本
``` ```
本地构建并安装 本地构建并安装
``` ```
python3 setup.py bdist_wheel python3 setup.py bdist_wheel
pip3 install dist/paddleocr-x.x.x-py3-none-any.whl # x.x.x是paddleocr的版本号 pip3 install dist/paddleocr-x.x.x-py3-none-any.whl # x.x.x是paddleocr的版本号
``` ```
<a name="快速使用"></a>
## 2 快速使用 ## 2 快速使用
<a name="命令行运行"></a>
### 2.1 命令行运行 ### 2.1 命令行运行
查看帮助信息 查看帮助信息
...@@ -53,7 +59,7 @@ pip3 install dist/paddleocr-x.x.x-py3-none-any.whl # x.x.x是paddleocr的版本 ...@@ -53,7 +59,7 @@ pip3 install dist/paddleocr-x.x.x-py3-none-any.whl # x.x.x是paddleocr的版本
paddleocr -h paddleocr -h
``` ```
* 运行检测+识别 * 整图预测(检测+识别)
Paddleocr目前支持80个语种,可以通过修改--lang参数进行切换,具体支持的[语种](#语种缩写)可查看表格。 Paddleocr目前支持80个语种,可以通过修改--lang参数进行切换,具体支持的[语种](#语种缩写)可查看表格。
...@@ -72,19 +78,21 @@ paddleocr --image_dir doc/imgs/japan_2.jpg --lang=japan ...@@ -72,19 +78,21 @@ paddleocr --image_dir doc/imgs/japan_2.jpg --lang=japan
...... ......
``` ```
* 识别 * 识别预测
```bash ```bash
paddleocr --image_dir doc/imgs_words/japan/1.jpg --det false --lang=japan paddleocr --image_dir doc/imgs_words/japan/1.jpg --det false --lang=japan
``` ```
![](https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/release/2.0/doc/imgs_words/japan/1.jpg) ![](https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/release/2.0/doc/imgs_words/japan/1.jpg)
结果是一个tuple,返回识别结果和识别置信度 结果是一个tuple,返回识别结果和识别置信度
```text ```text
('したがって', 0.99965394) ('したがって', 0.99965394)
``` ```
* 检测 * 检测预测
``` ```
paddleocr --image_dir PaddleOCR/doc/imgs/11.jpg --rec false paddleocr --image_dir PaddleOCR/doc/imgs/11.jpg --rec false
...@@ -99,11 +107,12 @@ paddleocr --image_dir PaddleOCR/doc/imgs/11.jpg --rec false ...@@ -99,11 +107,12 @@ paddleocr --image_dir PaddleOCR/doc/imgs/11.jpg --rec false
...... ......
``` ```
<a name="python_脚本运行"></a>
### 2.2 python 脚本运行 ### 2.2 python 脚本运行
ppocr 也支持在python脚本中运行,便于嵌入到您自己的代码中: ppocr 也支持在python脚本中运行,便于嵌入到您自己的代码中:
* 检测+识别 * 整图预测(检测+识别)
``` ```
from paddleocr import PaddleOCR, draw_ocr from paddleocr import PaddleOCR, draw_ocr
...@@ -131,7 +140,7 @@ im_show.save('result.jpg') ...@@ -131,7 +140,7 @@ im_show.save('result.jpg')
![](https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/release/2.0/doc/imgs_results/korean.jpg) ![](https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/release/2.0/doc/imgs_results/korean.jpg)
* 单独执行识别 * 识别预测
``` ```
from paddleocr import PaddleOCR from paddleocr import PaddleOCR
...@@ -150,7 +159,7 @@ for line in result: ...@@ -150,7 +159,7 @@ for line in result:
('leider auch jetzt', 0.97538936) ('leider auch jetzt', 0.97538936)
``` ```
* 单独执行检 * 检测预
```python ```python
from paddleocr import PaddleOCR, draw_ocr from paddleocr import PaddleOCR, draw_ocr
...@@ -176,13 +185,21 @@ im_show.save('result.jpg') ...@@ -176,13 +185,21 @@ im_show.save('result.jpg')
...... ......
``` ```
结果可视化(todo:换图) 结果可视化
![](https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/release/2.0/doc/imgs_results/whl/12_det.jpg) ![](https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/release/2.0/doc/imgs_results/whl/12_det.jpg)
ppocr 还支持方向分类, 更多使用方式请参考:[whl包使用说明](https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.0/doc/doc_ch/whl.md) ppocr 还支持方向分类, 更多使用方式请参考:[whl包使用说明](https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.0/doc/doc_ch/whl.md)
<a name="语种缩写"></a>
### 自定义训练
ppocr 支持使用自己的数据进行自定义训练或finetune, 其中识别模型可以参考 [法语配置文件](../../configs/rec/multi_language/rec_french_lite_train.yml)
修改训练数据路径、字典等参数。
具体数据准备、训练过程可参考:[文本检测](../doc_ch/detection.md)[文本识别](../doc_ch/recognition.md),更多功能如预测部署、
数据标注等功能可以阅读完整的[文档教程](../../README_ch.md)
<a name="语种缩写"></a>
### 支持语种及缩写 ### 支持语种及缩写
| 语种 | 描述 | 缩写 | | 语种 | 描述 | 缩写 |
...@@ -214,77 +231,53 @@ ppocr 还支持方向分类, 更多使用方式请参考:[whl包使用说明 ...@@ -214,77 +231,53 @@ ppocr 还支持方向分类, 更多使用方式请参考:[whl包使用说明
|泰卢固文|Telugu |te| |泰卢固文|Telugu |te|
|卡纳达文|Kannada |kn| |卡纳达文|Kannada |kn|
|泰米尔文|Tamil |ta| |泰米尔文|Tamil |ta|
| | |af| |南非荷兰文 |Afrikaans |af|
| | |az| |阿塞拜疆文 |Azerbaijani |az|
| | |bs| |波斯尼亚文|Bosnian|bs|
| | |cs| |捷克文|Czech|cs|
| | |cy| |威尔士文 |Welsh |cy|
| | |da| |丹麦文 |Danish|da|
| | |de| |爱沙尼亚文 |Estonian |et|
| | |en| |爱尔兰文 |Irish |ga|
| | |es| |克罗地亚文|Croatian |hr|
| | |et| |匈牙利文|Hungarian |hu|
| | |fr| |印尼文|Indonesian|id|
| | |ga| |冰岛文 |Icelandic|is|
| | |hr| |库尔德文 |Kurdish|ku|
| | |hu| |立陶宛文|Lithuanian |lt|
| | |id| |拉脱维亚文 |Latvian |lv|
| | |is| |毛利文|Maori|mi|
| | |it| |马来文 |Malay|ms|
| | |ku| |马耳他文 |Maltese |mt|
| | |la| |荷兰文 |Dutch |nl|
| | |lt| |挪威文 |Norwegian |no|
| | |lv| |波兰文|Polish |pl|
| | |mi| | 罗马尼亚文|Romanian |ro|
| | |ms| | 斯洛伐克文|Slovak |sk|
| | |mt| | 斯洛文尼亚文|Slovenian |sl|
| | |nl| | 阿尔巴尼亚文|Albanian |sq|
| | |no| | 瑞典文|Swedish |sv|
| | |oc| | 西瓦希里文|Swahili |sw|
| | |pi| | 塔加洛文|Tagalog |tl|
| | |pl| | 土耳其文|Turkish |tr|
| | |pt| | 乌兹别克文|Uzbek |uz|
| | |ro| | 越南文|Vietnamese |vi|
| | |rs_latin| | 蒙古文|Mongolian |mn|
| | |sk| | 阿巴扎文|Abaza |abq|
| | |sl| | 阿迪赫文|Adyghe |ady|
| | |sq| | 卡巴丹文|Kabardian |kbd|
| | |sv| | 阿瓦尔文|Avar |ava|
| | |sw| | 达尔瓦文|Dargwa |dar|
| | |tl| | 因古什文|Ingush |inh|
| | |tr| | 拉克文|Lak |lbe|
| | |uz| | 莱兹甘文|Lezghian |lez|
| | |vi| |塔巴萨兰文 |Tabassaran |tab|
| | |ar| | 比尔哈文|Bihari |bh|
| | |fa| | 迈蒂利文|Maithili |mai|
| | |ug| | 昂加文|Angika |ang|
| | |ur| | 孟加拉文|Bhojpuri |bho|
| | |ru| | 摩揭陀文 |Magahi |mah|
| | |rs_cyrillic| | 那格浦尔文|Nagpur |sck|
| | |be| | 尼瓦尔文|Newari |new|
| | |bg| | 保加利亚文 |Goan Konkani|gom|
| | |uk| | 沙特阿拉伯文|Saudi Arabia|sa|
| | |mn|
| | |abq|
| | |ady|
| | |kbd|
| | |ava|
| | |dar|
| | |inh|
| | |che|
| | |lbe|
| | |lez|
| | |tab|
| | |hi|
| | |mr|
| | |ne|
| | |bh|
| | |mai|
| | |ang|
| | |bho|
| | |mah|
| | |sck|
| | |new|
| | |gom|
| | |sa|
| | |bgc|
doc/imgs_results/whl/12_det.jpg

166.3 KB | W: | H:

doc/imgs_results/whl/12_det.jpg

409.6 KB | W: | H:

doc/imgs_results/whl/12_det.jpg
doc/imgs_results/whl/12_det.jpg
doc/imgs_results/whl/12_det.jpg
doc/imgs_results/whl/12_det.jpg
  • 2-up
  • Swipe
  • Onion skin
...@@ -32,7 +32,7 @@ setup( ...@@ -32,7 +32,7 @@ setup(
package_dir={'paddleocr': ''}, package_dir={'paddleocr': ''},
include_package_data=True, include_package_data=True,
entry_points={"console_scripts": ["paddleocr= paddleocr.paddleocr:main"]}, entry_points={"console_scripts": ["paddleocr= paddleocr.paddleocr:main"]},
version='2.0.3', version='2.0.4',
install_requires=requirements, install_requires=requirements,
license='Apache License 2.0', license='Apache License 2.0',
description='Awesome OCR toolkits based on PaddlePaddle (8.6M ultra-lightweight pre-trained model, support training and deployment among server, mobile, embeded and IoT devices', description='Awesome OCR toolkits based on PaddlePaddle (8.6M ultra-lightweight pre-trained model, support training and deployment among server, mobile, embeded and IoT devices',
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册