提交 e9f56354 编写于 作者: qq_25193841's avatar qq_25193841

update i18n readme

update i18n readme
上级 4c4468ba
...@@ -20,17 +20,18 @@ PaddleOCR стремится создавать многоязычные, пот ...@@ -20,17 +20,18 @@ PaddleOCR стремится создавать многоязычные, пот
<div align="center"> <div align="center">
<img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800"> <img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800">
</div> </div>
<div align="center"> <div align="center">
<img src="./doc/imgs_results/PP-OCRv3/en/en_4.png" width="800"> <img src="../imgs_results/PP-OCRv3/en/en_4.png" width="800">
</div> </div>
<div align="center"> <div align="center">
<img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800"> <img src="../imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800">
</div> </div>
## 📣 Последние обновления ## 📣 Последние обновления
- **🔥2022.8.24 Выпуск PaddleOCR [Выпуск /2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)** - **🔥2022.8.24 Выпуск PaddleOCR [Выпуск /2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)**
- Выпускать [PP-Structurev2](./ppstructure/),с полностью обновленными функциями и производительностью, адаптированными для китайских сцен и новой поддержкой pаспознавание таблиц - Выпускать [PP-Structurev2](./ppstructure/),с полностью обновленными функциями и производительностью, адаптированными для китайских сцен и новой поддержкой pаспознавание таблиц
...@@ -38,18 +39,18 @@ PaddleOCR стремится создавать многоязычные, пот ...@@ -38,18 +39,18 @@ PaddleOCR стремится создавать многоязычные, пот
- [Анализ макета](./ppstructure/layout) оптимизация: память модели уменьшена на 95%, а скорость увеличена в 11 раз, а среднее время процессорного времени составляет всего 41 мс; - [Анализ макета](./ppstructure/layout) оптимизация: память модели уменьшена на 95%, а скорость увеличена в 11 раз, а среднее время процессорного времени составляет всего 41 мс;
- [Распознавание таблиц](./ppstructure/table) оптимизация: разработано 3 стратегии оптимизации, а точность модели улучшена на 6% при сопоставимых затратах времени; - [Распознавание таблиц](./ppstructure/table) оптимизация: разработано 3 стратегии оптимизации, а точность модели улучшена на 6% при сопоставимых затратах времени;
- [Извлечение ключевой информации](./ppstructure/kie) оптимизация: разработана визуально независимая структура модели, точность распознавания семантической сущности увеличена на 2,8%, а точность извлечения отношения увеличена на 9,1%. - [Извлечение ключевой информации](./ppstructure/kie) оптимизация: разработана визуально независимая структура модели, точность распознавания семантической сущности увеличена на 2,8%, а точность извлечения отношения увеличена на 9,1%.
- **🔥2022.7 Выпуск [Коллекция приложений сцены OCR](./applications/README_en.md)** - **🔥2022.7 Выпуск [Коллекция приложений сцены OCR](../../applications/README_en.md)**
- Выпуск **9 вертикальных моделей**, таких как цифровая трубка, ЖК-экран, номерной знак, модель распознавания рукописного ввода, высокоточная модель SVTR и т. д., охватывающих основные вертикальные приложения OCR в целом, производственной, финансовой и транспортной отраслях. - Выпуск **9 вертикальных моделей**, таких как цифровая трубка, ЖК-экран, номерной знак, модель распознавания рукописного ввода, высокоточная модель SVTR и т. д., охватывающих основные вертикальные приложения OCR в целом, производственной, финансовой и транспортной отраслях.
- **🔥2022.5.9 Выпуск PaddleOCR [Выпуск /2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)** - **🔥2022.5.9 Выпуск PaddleOCR [Выпуск /2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)**
- Выпускать [PP-OCRv3](./doc/doc_en/ppocr_introduction_en.md#pp-ocrv3): При сопоставимой скорости эффект китайской сцены улучшен на 5% по сравнению с ПП-OCRRv2, эффект английской сцены улучшен на 11%, а средняя точность распознавания 80 языковых многоязычных моделей улучшена более чем на 5%. - Выпускать [PP-OCRv3](../doc_en/ppocr_introduction_en.md#pp-ocrv3): При сопоставимой скорости эффект китайской сцены улучшен на 5% по сравнению с ПП-OCRRv2, эффект английской сцены улучшен на 11%, а средняя точность распознавания 80 языковых многоязычных моделей улучшена более чем на 5%.
- Выпускать [PPOCRLabelv2](./PPOCRLabel): Добавьте функцию аннотации для задачи распознавания таблиц, задачи извлечения ключевой информации и изображения неправильного текста. - Выпускать [PPOCRLabelv2](./PPOCRLabel): Добавьте функцию аннотации для задачи распознавания таблиц, задачи извлечения ключевой информации и изображения неправильного текста.
- Выпустить интерактивную электронную книгу [*"Погружение в OCR"*](./doc/doc_en/ocr_book_en.md), охватывает передовую теорию и практику кодирования технологии полного стека OCR. - Выпустить интерактивную электронную книгу [*"Погружение в OCR"*](../doc_en/ocr_book_en.md), охватывает передовую теорию и практику кодирования технологии полного стека OCR.
- [подробнее](./doc/doc_en/update_en.md) - [подробнее](../doc_en/update_en.md)
## 🌟 Функции ## 🌟 Функции
PaddleOCR поддерживает множество передовых алгоритмов, связанных с распознаванием текста, и разработала промышленные модели/решения. [PP-OCR](./doc/doc_en/ppocr_introduction_en.md) и [PP-Structure](./ppstructure/README.md) на этой основе и пройти весь процесс производства данных, обучения модели, сжатия, логического вывода и развертывания. PaddleOCR поддерживает множество передовых алгоритмов, связанных с распознаванием текста, и разработала промышленные модели/решения. [PP-OCR](../doc_en/ppocr_introduction_en.md) и [PP-Structure](./ppstructure/README.md) на этой основе и пройти весь процесс производства данных, обучения модели, сжатия, логического вывода и развертывания.
<div align="center"> <div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186171245-40abc4d7-904f-4949-ade1-250f86ed3a90.png"> <img src="https://user-images.githubusercontent.com/25809855/186171245-40abc4d7-904f-4949-ade1-250f86ed3a90.png">
...@@ -62,12 +63,12 @@ pip3 install paddleocr ...@@ -62,12 +63,12 @@ pip3 install paddleocr
paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
``` ```
> Если у вас нет среды Python, выполните [Подготовка среды](./doc/doc_en/environment_en.md). Мы рекомендуем вам начать с [Учебники](#Tutorials). > Если у вас нет среды Python, выполните [Подготовка среды](../doc_en/environment_en.md). Мы рекомендуем вам начать с [Учебники](#Tutorials).
<a name="книга"></a> <a name="книга"></a>
## 📚 Электронная книга: *Погружение в OCR* ## 📚 Электронная книга: *Погружение в OCR*
- [Погружение в распознавание символов](./doc/doc_en/ocr_book_en.md) - [Погружение в распознавание символов](../doc_en/ocr_book_en.md)
<a name="Сообщество"></a> <a name="Сообщество"></a>
...@@ -85,73 +86,71 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -85,73 +86,71 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
| Английский сверхлегкая модель ПП-OCRv3 (13,4 Мб) | en\_ПП-OCRv3_xx |Мобильный и сервер | [модель вывода](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_distill_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar) | | Английский сверхлегкая модель ПП-OCRv3 (13,4 Мб) | en\_ПП-OCRv3_xx |Мобильный и сервер | [модель вывода](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_distill_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar) |
| Сверхлегкая китайская и английская модель ПП-OCRv3 (16,2M) | ch\_ПП-OCRv3_xx | Мобильный и сервер | [вывод модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) | | Сверхлегкая китайская и английская модель ПП-OCRv3 (16,2M) | ch\_ПП-OCRv3_xx | Мобильный и сервер | [вывод модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) |
- Для получения дополнительных загрузок моделей (включая несколько языков) см. [Загрузки моделей серии ПП-OCR](./doc/doc_en/models_list_en.md). - Для получения дополнительных загрузок моделей (включая несколько языков) см. [Загрузки моделей серии ПП-OCR](../doc_en/models_list_en.md).
- Для запроса нового языка см[Руководство для новых языковых_запросов] (#language_requests). - Для запроса нового языка см [Руководство для новых языковых_запросов](#language_requests).
- Модели структурного анализа документов см[PP-Structure модельs](./ppstructure/docs/модельs_list_en.md). - Модели структурного анализа документов см [PP-Structure модельs](./ppstructure/docs/модельs_list_en.md).
<a name=" Учебники "></a> <a name=" Учебники "></a>
## 📖 Учебники ## 📖 Учебники
- [Подготовка окружающей среды](./doc/doc_en/environment_en.md) - [Подготовка окружающей среды](../doc_en/environment_en.md)
- [PP-OCR 🔥](./doc/doc_en/ppocr_introduction_en.md) - [PP-OCR 🔥](../doc_en/ppocr_introduction_en.md)
- [Быстрый старт](doc/doc_en/quickstart_en.md) - [Быстрый старт](../doc_en/quickstart_en.md)
- [Модель Zoo](./doc/doc_en/модельs_en.md) - [Модель Zoo](../doc_en/модельs_en.md)
- [Модель тренировки](./doc/doc_en/training_en.md) - [Модель тренировки](../doc_en/training_en.md)
- [Обнаружение текста](./doc/doc_en/detection_en.md) - [Обнаружение текста](../doc_en/detection_en.md)
- [Распознавание текста](./doc/doc_en/recognition_en.md) - [Распознавание текста](../doc_en/recognition_en.md)
- [Классификация направления текста](./doc/doc_en/angle_class_en.md) - [Классификация направления текста](../doc_en/angle_class_en.md)
- Модель Сжатие - Модель Сжатие
- [Модель квантования](./deploy/slim/quantization/README_en.md) - [Модель квантования](./deploy/slim/quantization/README_en.md)
- [Модель Обрезка](./deploy/slim/prune/README_en.md) - [Модель Обрезка](./deploy/slim/prune/README_en.md)
- [Дистилляция знаний](./doc/doc_en/knowledge_distillation_en.md) - [Дистилляция знаний](../doc_en/knowledge_distillation_en.md)
- [Вывод и развертывание](./deploy/README.md) - [Вывод и развертывание](./deploy/README.md)
- [Python Вывод](./doc/doc_en/ inference _ppocr_en.md) - [Python Вывод](../doc_en/ inference _ppocr_en.md)
- [Вывод C++](./deploy/cpp_infer/readme.md) - [Вывод C++](./deploy/cpp_infer/readme.md)
-[Подача](./deploy/pdserving/README.md) -[Подача](./deploy/pdserving/README.md)
- [Мобильный](./deploy/lite/readme.md) - [Мобильный](./deploy/lite/readme.md)
- [Paddle2ONNX](./deploy/paddle2onnx/readme.md) - [Paddle2ONNX](./deploy/paddle2onnx/readme.md)
-[ВеслоОблако](./deploy/paddlecloud/README.md) -[ВеслоОблако](./deploy/paddlecloud/README.md)
- [Benchmark](./doc/doc_en/benchmark_en.md) - [Benchmark](../doc_en/benchmark_en.md)
- [PP-Structure 🔥](./ppstructure/README.md) - [PP-Structure 🔥](../../ppstructure/README.md)
- [Быстрый старт](../../ppstructure/docs/quickstart_en.md)
- [Быстрый старт](./ppstructure/docs/quickstart_en.md) - [Модель Zoo](../../ppstructure/docs/models_list_en.md)
- [Модель тренировки](../doc_en/training_en.md)
- [Модель Zoo](./ppstructure/docs/модельs_list_en.md) - [Анализ макета](../../ppstructure/layout/README.md)
- [Модель тренировки](./doc/doc_en/training_en.md) - [Распознавание таблиц](../../ppstructure/table/README.md)
- [Анализ макета](./ppstructure/layout/README.md) - [Извлечение ключевой информации](../../ppstructure/kie/README.md)
- [Распознавание таблиц](./ppstructure/table/README.md)
- [Извлечение ключевой информации](./ppstructure/kie/README.md)
- [Вывод и развертывание](./deploy/README.md) - [Вывод и развертывание](./deploy/README.md)
- [Вывод Python](./ppstructure/docs/inference_en.md) - [Вывод Python](../../ppstructure/docs/inference_en.md)
- [Вывод С++](./deploy/cpp_infer/readme.md) - [Вывод С++](../../deploy/cpp_infer/readme.md)
- [Обслуживание](./deploy/hubserving/readme_en.md) - [Обслуживание](../../deploy/hubserving/readme_en.md)
- [Академические алгоритмы](./doc/doc_en/algorithm_overview_en.md) - [Академические алгоритмы](../doc_en/algorithm_overview_en.md)
- [Обнаружение текста](./doc/doc_en/algorithm_overview_en.md) - [Обнаружение текста](../doc_en/algorithm_overview_en.md)
- [Распознавание текста](./doc/doc_en/algorithm_overview_en.md) - [Распознавание текста](../doc_en/algorithm_overview_en.md)
- [Непрерывной цепью OCR](./doc/doc_en/algorithm_overview_en.md) - [Непрерывной цепью OCR](../doc_en/algorithm_overview_en.md)
- [Распознавание таблиц](./doc/doc_en/algorithm_overview_en.md) - [Распознавание таблиц](../doc_en/algorithm_overview_en.md)
- [Извлечение ключевой информации](./doc/doc_en/algorithm_overview_en.md) - [Извлечение ключевой информации](../doc_en/algorithm_overview_en.md)
- [Добавьте новые алгоритмы в PaddleOCR](./doc/doc_en/add_new_algorithm_en.md) - [Добавьте новые алгоритмы в PaddleOCR](../doc_en/add_new_algorithm_en.md)
- Аннотации и синтез данных - Аннотации и синтез данных
- [Полуавтоматический инструмент аннотации данных: метка ППOCRR](./PPOCRLabel/README.md) - [Полуавтоматический инструмент аннотации данных: метка ППOCRR](./PPOCRLabel/README.md)
- [Инструмент синтеза данных: Стиль-текст](./StyleText/README.md) - [Инструмент синтеза данных: Стиль-текст](./StyleText/README.md)
- [Другие инструменты аннотирования данных](./doc/doc_en/data_annotation_en.md) - [Другие инструменты аннотирования данных](../doc_en/data_annotation_en.md)
- [Другие инструменты синтеза данных](./doc/doc_en/data_synthesis_en.md) - [Другие инструменты синтеза данных](../doc_en/data_synthesis_en.md)
- Наборы данных - Наборы данных
- [Общие наборы данных OCR (китайский/английский)](doc/doc_en/dataset/datasets_en.md) - [Общие наборы данных OCR (китайский/английский)](../doc_en/dataset/datasets_en.md)
- [Наборы данных Рукописный/_OCR_ наборы данных (китайский)](doc/doc_en/dataset/handwritten_datasets_en.md) - [Наборы данных Рукописный/_OCR_ наборы данных (китайский)](../doc_en/dataset/handwritten_datasets_en.md)
- [Различные наборы данных OCR (многоязычные)](doc/doc_en/dataset/vertical_and_multilingual_datasets_en.md) - [Различные наборы данных OCR (многоязычные)](../doc_en/dataset/vertical_and_multilingual_datasets_en.md)
- [Анализ макета](doc/doc_en/dataset/layout_datasets_en.md) - [Анализ макета](../doc_en/dataset/layout_datasets_en.md)
- [Распознавание таблиц](doc/doc_en/dataset/table_datasets_en.md) - [Распознавание таблиц](../doc_en/dataset/table_datasets_en.md)
- [Извлечение ключевой информации](doc/doc_en/dataset/kie_datasets_en.md) - [Извлечение ключевой информации](../doc_en/dataset/kie_datasets_en.md)
- [Структура кода](./doc/doc_en/tree_en.md) - [Структура кода](../doc_en/tree_en.md)
- [Визуализация](#Visualization) - [Визуализация](#Visualization)
- [Сообщество](#Community) - [Сообщество](#Community)
- [Новые языковые запросы](#language_requests) - [Новые языковые запросы](#language_requests)
- [ЧАСТО ЗАДАВАЕМЫЕ ВOCRОСЫ](./doc/doc_en/FAQ_en.md) - [ЧАСТО ЗАДАВАЕМЫЕ ВOCRОСЫ](../doc_en/FAQ_en.md)
- [Использованная литература](./doc/doc_en/reference_en.md) - [Использованная литература](../doc_en/reference_en.md)
- [ЛИЦЕНЗИЯ](#LICENSE) - [ЛИЦЕНЗИЯ](#LICENSE)
<a name="language_requests"></a> <a name="language_requests"></a>
...@@ -166,29 +165,29 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -166,29 +165,29 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
<a name=" Визуализация "></a> <a name=" Визуализация "></a>
## 👀 Визуализация [больше](./doc/doc_en/visualization_en.md) ## 👀 Визуализация [больше](../doc_en/visualization_en.md)
<details open> <details open>
<summary>PP-OCRv3 Многоязычная модель </summary> <summary>PP-OCRv3 Многоязычная модель </summary>
<div align="center"> <div align="center">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800">
</div> </div>
</details> </details>
<details open> <details open>
<summary>PP-OCRv3 Aнглийская модель </summary> <summary>PP-OCRv3 Aнглийская модель </summary>
<div align="center"> <div align="center">
<img src="doc/imgs_results/PP-OCRv3/en/en_1.png" width="800"> <img src="../imgs_results/PP-OCRv3/en/en_1.png" width="800">
<img src="doc/imgs_results/PP-OCRv3/en/en_2.png" width="800"> <img src="../imgs_results/PP-OCRv3/en/en_2.png" width="800">
</div> </div>
</details> </details>
<details open> <details open>
<summary>PP-OCRv3 Kитайская модель </summary> <summary>PP-OCRv3 Kитайская модель </summary>
<div align="center"> <div align="center">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800">
</div> </div>
</details> </details>
...@@ -196,7 +195,7 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -196,7 +195,7 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
<summary>PP-Structurev2</summary> <summary>PP-Structurev2</summary>
1. анализ макета + распознавание таблиц 1. анализ макета + распознавание таблиц
<div align="center"> <div align="center">
<img src="./ppstructure/docs/table/ppstructure.GIF" width="800"> <img src="../../ppstructure/docs/table/ppstructure.GIF" width="800">
</div> </div>
2. SER (Семантическое распознавание объектов) 2. SER (Семантическое распознавание объектов)
<div align="center"> <div align="center">
...@@ -219,6 +218,7 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -219,6 +218,7 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
<img src="https://user-images.githubusercontent.com/14270174/185540080-0431e006-9235-4b6d-b63d-0b3c6e1de48f.jpg" width="600"> <img src="https://user-images.githubusercontent.com/14270174/185540080-0431e006-9235-4b6d-b63d-0b3c6e1de48f.jpg" width="600">
</div> </div>
</details> </details>
<a name="ЛИЦЕНЗИЯ"></a> <a name="ЛИЦЕНЗИЯ"></a>
## 📄 Лицензия ## 📄 Лицензия
......
...@@ -19,38 +19,38 @@ English | [简体中文](README_ch.md) ...@@ -19,38 +19,38 @@ English | [简体中文](README_ch.md)
<div align="center"> <div align="center">
<img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800"> <img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800">
</div> </div>
<div align="center"> <div align="center">
<img src="./doc/imgs_results/PP-OCRv3/en/en_4.png" width="800"> <img src="../imgs_results/PP-OCRv3/en/en_4.png" width="800">
</div> </div>
<div align="center"> <div align="center">
<img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800"> <img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800">
</div> </div>
## 📣 हाल के अद्यतन ## 📣 हाल के अद्यतन
- **🔥2022.8.24 रिलीज Paddleओसीआर [रिलीज/2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)** - **🔥2022.8.24 रिलीज Paddleओसीआर [रिलीज/2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)**
- रिलीज [PP-Structurev2](./ppstructure/),फंक्शन और परफॉरमेंस के साथ पूरी तरह से उन्नत, चायनीज शीन्स के अनुकूल, और मदद के लिए [लेआउट रिकवरी](./ppstructure/recovery) और **पीडीएफ को वर्ड में बदलने के लिए वन लाइन कमांड**; - रिलीज [PP-Structurev2](../../ppstructure),फंक्शन और परफॉरमेंस के साथ पूरी तरह से उन्नत, चायनीज शीन्स के अनुकूल, और मदद के लिए [लेआउट रिकवरी](../../ppstructure/recovery) और **पीडीएफ को वर्ड में बदलने के लिए वन लाइन कमांड**;
- [लेआउट एनालाइस](./ppstructure/layout) ऑप्टिमाइजेशन: मॉडल स्टोरेज में 95% की कमी, जबकि स्पीड में 11 गुना वृद्धि , और एवरेज CPU स टाइम-कॉस्ट केवल 41ms है; - [लेआउट एनालाइस](../../ppstructure/layout) ऑप्टिमाइजेशन: मॉडल स्टोरेज में 95% की कमी, जबकि स्पीड में 11 गुना वृद्धि , और एवरेज CPU स टाइम-कॉस्ट केवल 41ms है;
- [टेबल रिकोगनाइजेशन](./ppstructure/table) ऑप्टिमाइजेशन: 3 ऑप्टिमाइज़ेशन के तरीके डिजाइन किए गए हैं, और तुलनात्मक समय की खपत के तहत मॉडल सटीकता में 6% का सुधार हुआ है; - [टेबल रिकोगनाइजेशन](../../ppstructure/table) ऑप्टिमाइजेशन: 3 ऑप्टिमाइज़ेशन के तरीके डिजाइन किए गए हैं, और तुलनात्मक समय की खपत के तहत मॉडल सटीकता में 6% का सुधार हुआ है;
- [की इंफॉर्मेशन एक्स्ट्रेक्शन](./ppstructure/kie) ऑप्टिमाइजेशन : एक बिजुवल-स्वतंत्र मॉडल संरचना डिजाइन की गई है, सिमेंटिक एन्टाइटी रिकग्निशन की सटीकता में 2.8% की वृद्धि हुई है, और रिलेशन एक्सट्रैक्शन की सटीकता में 9.1% की वृद्धि हुई है। - [की इंफॉर्मेशन एक्स्ट्रेक्शन](../../ppstructure/kie) ऑप्टिमाइजेशन : एक बिजुवल-स्वतंत्र मॉडल संरचना डिजाइन की गई है, सिमेंटिक एन्टाइटी रिकग्निशन की सटीकता में 2.8% की वृद्धि हुई है, और रिलेशन एक्सट्रैक्शन की सटीकता में 9.1% की वृद्धि हुई है।
- **🔥2022.7 रिलीज [ओसीआर दृश्य आवेदन संग्रह](./applications/README_en.md)** - **🔥2022.7 रिलीज [ओसीआर दृश्य आवेदन संग्रह](../../applications/README_en.md)**
- रिलीज **9 वर्टिकल मॉडल** जैसे कि डिजिटल ट्यूब, एलसीडी स्क्रीन, लाइसेंस प्लेट, हस्तलेखन पहचान मॉडल, उच्च-सटीक एसवीटीआर मॉडल, आदि, जो सामान्य रूप से मुख्य ओसीआर वर्टिकल अनुप्रयोगों, विनिर्माण, वित्त और परिवहन उद्योगों को कवर करते हैं। - रिलीज **9 वर्टिकल मॉडल** जैसे कि डिजिटल ट्यूब, एलसीडी स्क्रीन, लाइसेंस प्लेट, हस्तलेखन पहचान मॉडल, उच्च-सटीक एसवीटीआर मॉडल, आदि, जो सामान्य रूप से मुख्य ओसीआर वर्टिकल अनुप्रयोगों, विनिर्माण, वित्त और परिवहन उद्योगों को कवर करते हैं।
- **🔥2022.5.9 रिलीज Paddleओसीआर [रिलीज/2.5](https://github.com/PaddlePaddle/Paddleओसीआर/tree/release/2.5)** - **🔥2022.5.9 रिलीज Paddleओसीआर [रिलीज/2.5](https://github.com/PaddlePaddle/Paddleओसीआर/tree/release/2.5)**
- रिलीज [PP-OCRv3](./doc/doc_en/ppocr_introduction_en.md#pp-ocrv3): तुलनात्मक स्पीड के साथ, चाइनीज शीन्स का प्रभाव PP-ओसीआर v2 की तुलना में 5% की और वृद्धि हुयी है इंगलिस शीन्स के प्रभाव में 11% का सुधार हुआ है, और 80 भाषाओं के बहुभाषी मॉडलों की औसत पहचान सटीकता में 5% से अधिक सुधार हुआ है। - रिलीज [PP-OCRv3](../doc_en/ppocr_introduction_en.md#pp-ocrv3): तुलनात्मक स्पीड के साथ, चाइनीज शीन्स का प्रभाव PP-ओसीआर v2 की तुलना में 5% की और वृद्धि हुयी है इंगलिस शीन्स के प्रभाव में 11% का सुधार हुआ है, और 80 भाषाओं के बहुभाषी मॉडलों की औसत पहचान सटीकता में 5% से अधिक सुधार हुआ है।
- रिलीज़ [PPOCRLabelv2](./PPOCRLabel): टेबल टेबल रिकोगनाइजेशन टास्क की इंफॉर्मेशन एक्स्ट्रेक्शन टास्क और अनियमित टेक्सट इमेज के लिए एनोटेशन फ़ंक्शन एड करे। - रिलीज़ [PPOCRLabelv2](./PPOCRLabel): टेबल टेबल रिकोगनाइजेशन टास्क की इंफॉर्मेशन एक्स्ट्रेक्शन टास्क और अनियमित टेक्सट इमेज के लिए एनोटेशन फ़ंक्शन एड करे।
- इंटरएक्टिव ई-बुक जारी करें [*"ओसीआर में गोता लगाएँ"*](./doc/doc_en/ocr_book_en.md), ओसीआर पूर्ण स्टैक तकनीक के अत्याधुनिक सिद्धांत और कोड प्रेक्टिस को कवर करता है। - इंटरएक्टिव ई-बुक जारी करें [*"ओसीआर में गोता लगाएँ"*](../doc_en/ocr_book_en.md), ओसीआर पूर्ण स्टैक तकनीक के अत्याधुनिक सिद्धांत और कोड प्रेक्टिस को कवर करता है।
- [और अधिक](./doc/doc_en/update_en.md) - [और अधिक](../doc_en/update_en.md)
## 🌟 विशेषताएँ ## 🌟 विशेषताएँ
Paddleओसीआर से संबंधित विभिन्न प्रकार के अत्याधुनिक एल्गोरिथ्म को सपोर्ट करता है, और विकसित औद्योगिक विशेष रुप से प्रदर्शित मॉडल/समाधान [PP- OCR](./doc/doc_en/ppocr_introduction_en.md) और [PP-Structure](./ppstructure/README.md) इस आधार पर और डेटा प्रोडक्शन की पूरी प्रोसेस के माध्यम से प्राप्त करें, मॉडल ट्रेनिंग, दबाव, अनुमान और तैनाती। Paddleओसीआर से संबंधित विभिन्न प्रकार के अत्याधुनिक एल्गोरिथ्म को सपोर्ट करता है, और विकसित औद्योगिक विशेष रुप से प्रदर्शित मॉडल/समाधान [PP- OCR](../doc_en/ppocr_introduction_en.md) और [PP-Structure](../../ppstructure/README.md) इस आधार पर और डेटा प्रोडक्शन की पूरी प्रोसेस के माध्यम से प्राप्त करें, मॉडल ट्रेनिंग, दबाव, अनुमान और तैनाती।
<div align="center"> <div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186171245-40abc4d7-904f-4949-ade1-250f86ed3a90.png"> <img src="https://user-images.githubusercontent.com/25809855/186171245-40abc4d7-904f-4949-ade1-250f86ed3a90.png">
...@@ -63,12 +63,12 @@ pip3 install paddleocr ...@@ -63,12 +63,12 @@ pip3 install paddleocr
paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
``` ```
> यदि आपके पास पायथन एनवायरनमेंट नहीं है, कृपया फॉलो कीजिए [एनवायरनमेंट प्रिपेरेशन](./doc/doc_en/environment_en.md). हम अनुशंसा करते हैं कि आप इसके साथ शुरुआत करें [ट्यूटोरियल](#Tutorials). > यदि आपके पास पायथन एनवायरनमेंट नहीं है, कृपया फॉलो कीजिए [एनवायरनमेंट प्रिपेरेशन](../doc_en/environment_en.md). हम अनुशंसा करते हैं कि आप इसके साथ शुरुआत करें [ट्यूटोरियल](#Tutorials).
<a name="किताब"></a> <a name="किताब"></a>
## 📚 ई-बुक: *ओसीआर में गोता लगाएँ* ## 📚 ई-बुक: *ओसीआर में गोता लगाएँ*
- [ओसीआर में गोता लगाएँ](./doc/doc_en/ocr_book_en.md) - [ओसीआर में गोता लगाएँ](../doc_en/ocr_book_en.md)
<a name="कम्युनिटी"></a> <a name="कम्युनिटी"></a>
...@@ -87,57 +87,57 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -87,57 +87,57 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
| चाइनीस और इंग्लिश अल्ट्रा- लाइट वेट PP-ओसीआरv3 मॉडल(16.2M) | ch_PP-ओसीआरv3_xx | मोबाइल और सर्वर | [इन्फरन्स मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [इन्फरन्स मॉडल](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) | | चाइनीस और इंग्लिश अल्ट्रा- लाइट वेट PP-ओसीआरv3 मॉडल(16.2M) | ch_PP-ओसीआरv3_xx | मोबाइल और सर्वर | [इन्फरन्स मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [इन्फरन्स मॉडल](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [प्रशिक्षित मॉडल](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) |
- अधिक मॉडल डाउनलोड (एकाधिक भाषाओं सहित) के लिए, कृपया [PP-ओसीआर सीरीज मॉडल डाउनलोड](./doc/doc_en/models_list_en.md) देखें। - अधिक मॉडल डाउनलोड (एकाधिक भाषाओं सहित) के लिए, कृपया [PP-ओसीआर सीरीज मॉडल डाउनलोड](../doc_en/models_list_en.md) देखें।
- एक नए भाषा अनुरोध के लिए, कृपया [नई भाषा अनुरोधों के लिए दिशानिर्देश](#language_requests). - एक नए भाषा अनुरोध के लिए, कृपया [नई भाषा अनुरोधों के लिए दिशानिर्देश](#language_requests).
- स्ट्रक्चर मॉडल डोकोमेंट एनालाइज के लिए, कृपया देखें [PP-Structure models](./ppstructure/docs/models_list_en.md). - स्ट्रक्चर मॉडल डोकोमेंट एनालाइज के लिए, कृपया देखें [PP-Structure models](../../ppstructure/docs/models_list_en.md).
<a name="ट्यूटोरियल"></a> <a name="ट्यूटोरियल"></a>
## 📖 ट्यूटोरियल ## 📖 ट्यूटोरियल
- [एनवायरनमेंट प्रिपरेशन](./doc/doc_en/environment_en.md) - [एनवायरनमेंट प्रिपरेशन](../doc_en/environment_en.md)
- [PP-OCR 🔥](./doc/doc_en/ppocr_introduction_en.md) - [PP-OCR 🔥](../doc_en/ppocr_introduction_en.md)
- [क्विक स्टार्ट](./doc/doc_en/quickstart_en.md) - [क्विक स्टार्ट](../doc_en/quickstart_en.md)
- [मॉडल जू](./doc/doc_en/models_en.md) - [मॉडल जू](../doc_en/models_en.md)
- [मॉडल ट्रेनिंग](./doc/doc_en/training_en.md) - [मॉडल ट्रेनिंग](../doc_en/training_en.md)
- [टेक्सट डिटेक्शन](./doc/doc_en/detection_en.md) - [टेक्सट डिटेक्शन](../doc_en/detection_en.md)
- [टेक्सट रिकोगनीशन](./doc/doc_en/recognition_en.md) - [टेक्सट रिकोगनीशन](../doc_en/recognition_en.md)
- [टेक्सट डायरेक्शन क्लासिफिकेशन](./doc/doc_en/angle_class_en.md) - [टेक्सट डायरेक्शन क्लासिफिकेशन](../doc_en/angle_class_en.md)
- मॉडल कम्प्रेशन - मॉडल कम्प्रेशन
- [मॉडल परिमाणीकरण](./deploy/slim/quantization/README_en.md) - [मॉडल परिमाणीकरण](./deploy/slim/quantization/README_en.md)
- [मॉडल प्रूनिंग](./deploy/slim/prune/README_en.md) - [मॉडल प्रूनिंग](./deploy/slim/prune/README_en.md)
- [ज्ञान आसवन](./doc/doc_en/knowledge_distillation_en.md) - [ज्ञान आसवन](../doc_en/knowledge_distillation_en.md)
- [इन्फरन्स और डिप्लोमेन्ट](./deploy/README.md) - [इन्फरन्स और डिप्लोमेन्ट](./deploy/README.md)
- [Python इन्फरन्स](./doc/doc_en/inference_ppocr_en.md) - [Python इन्फरन्स](../doc_en/inference_ppocr_en.md)
- [C++ इन्फरन्स](./deploy/cpp_infer/readme.md) - [C++ इन्फरन्स](./deploy/cpp_infer/readme.md)
- [सरविंग](./deploy/pdserving/README.md) - [सरविंग](./deploy/pdserving/README.md)
- [मोबाइल](./deploy/lite/readme.md) - [मोबाइल](./deploy/lite/readme.md)
- [Paddle2ONNX](./deploy/paddle2onnx/readme.md) - [Paddle2ONNX](./deploy/paddle2onnx/readme.md)
- [पैडल क्लाउड](./deploy/paddlecloud/README.md) - [पैडल क्लाउड](./deploy/paddlecloud/README.md)
- [Benchmark](./doc/doc_en/benchmark_en.md) - [Benchmark](../doc_en/benchmark_en.md)
- [PP-Structure 🔥](./ppstructure/README.md) - [PP-Structure 🔥](../../ppstructure/README.md)
- [क्विक स्टार्ट](./ppstructure/docs/quickstart_en.md) - [क्विक स्टार्ट](../../ppstructure/docs/quickstart_en.md)
- [मॉडल जू](./ppstructure/docs/models_list_en.md) - [मॉडल जू](../../ppstructure/docs/models_list_en.md)
- [मॉडल ट्रेनिंग](./doc/doc_en/training_en.md) - [मॉडल ट्रेनिंग](../doc_en/training_en.md)
- [लेआउट एनालाइस](./ppstructure/layout/README.md) - [लेआउट एनालाइस](../../ppstructure/layout/README.md)
- [टेबल रिकोगनाइजेशन](./ppstructure/table/README.md) - [टेबल रिकोगनाइजेशन](../../ppstructure/table/README.md)
- [की इंफॉर्मेशन एक्स्ट्रेक्शन](./ppstructure/kie/README.md) - [की इंफॉर्मेशन एक्स्ट्रेक्शन](../../ppstructure/kie/README.md)
- [इन्फरन्स और डिप्लोमेन्ट](./deploy/README.md) - [इन्फरन्स और डिप्लोमेन्ट](./deploy/README.md)
- [Python इन्फरन्स](./ppstructure/docs/inference_en.md) - [Python इन्फरन्स](../../ppstructure/docs/inference_en.md)
- [C++ इन्फरन्स](./deploy/cpp_infer/readme.md) - [C++ इन्फरन्स](./deploy/cpp_infer/readme.md)
- [सरविंग](./deploy/hubserving/readme_en.md) - [सरविंग](./deploy/hubserving/readme_en.md)
- [एकेडमिक एल्गोरिथम](./doc/doc_en/algorithm_overview_en.md) - [एकेडमिक एल्गोरिथम](../doc_en/algorithm_overview_en.md)
- [टेक्स्ट डिनेक्शन](./doc/doc_en/algorithm_overview_en.md) - [टेक्स्ट डिनेक्शन](../doc_en/algorithm_overview_en.md)
- [टेक्स्ट रिकोगनाइजेशन](./doc/doc_en/algorithm_overview_en.md) - [टेक्स्ट रिकोगनाइजेशन](../doc_en/algorithm_overview_en.md)
- [एंड-टू-एंड ओसीआर](./doc/doc_en/algorithm_overview_en.md) - [एंड-टू-एंड ओसीआर](../doc_en/algorithm_overview_en.md)
- [टेबल रिकोगनाइजेशन](./doc/doc_en/algorithm_overview_en.md) - [टेबल रिकोगनाइजेशन](../doc_en/algorithm_overview_en.md)
- [की इंफॉर्मेशन एक्स्ट्रेक्शन](./doc/doc_en/algorithm_overview_en.md) - [की इंफॉर्मेशन एक्स्ट्रेक्शन](../doc_en/algorithm_overview_en.md)
- [पैडलओसीआर में नए एल्गोरिदम जोड़ें](./doc/doc_en/add_new_algorithm_en.md) - [पैडलओसीआर में नए एल्गोरिदम जोड़ें](../doc_en/add_new_algorithm_en.md)
- डेटा एनोटेशन और सिंथेसिस - डेटा एनोटेशन और सिंथेसिस
- [सेमी-ऑटोमैटिक एनोटेशन टूल: PPओसीआरलेबल](./PPOCRLabel/README.md) - [सेमी-ऑटोमैटिक एनोटेशन टूल: PPओसीआरलेबल](./PPOCRLabel/README.md)
- [डेटा सिंथेसिस टूल: स्टाइल-टेक्सट](./StyleText/README.md) - [डेटा सिंथेसिस टूल: स्टाइल-टेक्सट](./StyleText/README.md)
- [अन्य डेटा एनोटेशन टूल](./doc/doc_en/data_annotation_en.md) - [अन्य डेटा एनोटेशन टूल](../doc_en/data_annotation_en.md)
- [अन्य डेटा सिंथेसिस टूल](./doc/doc_en/data_synthesis_en.md) - [अन्य डेटा सिंथेसिस टूल](../doc_en/data_synthesis_en.md)
- डेटा सेट - डेटा सेट
- [सामान्य ओसीआर डेटासेट (चीनी/अंग्रेज़ी)](doc/doc_en/dataset/datasets_en.md) - [सामान्य ओसीआर डेटासेट (चीनी/अंग्रेज़ी)](doc/doc_en/dataset/datasets_en.md)
- [हस्तलिखित_ओसीआर_डेटासेट (चीनी)](doc/doc_en/dataset/handwritten_datasets_en.md) - [हस्तलिखित_ओसीआर_डेटासेट (चीनी)](doc/doc_en/dataset/handwritten_datasets_en.md)
...@@ -146,12 +146,12 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -146,12 +146,12 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
- [लेआउट एनालाइस](doc/doc_en/dataset/layout_datasets_en.md) - [लेआउट एनालाइस](doc/doc_en/dataset/layout_datasets_en.md)
- [टेबल रिकोगनाइजेशन](doc/doc_en/dataset/table_datasets_en.md) - [टेबल रिकोगनाइजेशन](doc/doc_en/dataset/table_datasets_en.md)
- [की इंफॉर्मेशन एक्स्ट्रेक्शन](doc/doc_en/dataset/kie_datasets_en.md) - [की इंफॉर्मेशन एक्स्ट्रेक्शन](doc/doc_en/dataset/kie_datasets_en.md)
- [कोड संरचना](./doc/doc_en/tree_en.md) - [कोड संरचना](../doc_en/tree_en.md)
- [विसुमलाइजेशन](#Visualization) - [विसुमलाइजेशन](#Visualization)
- [कम्युनिटी](#Community) - [कम्युनिटी](#Community)
- [नई भाषा के लिए अनुरोध](#language_requests) - [नई भाषा के लिए अनुरोध](#language_requests)
- [सामान्य प्रश्न](./doc/doc_en/FAQ_en.md) - [सामान्य प्रश्न](../doc_en/FAQ_en.md)
- [रेफरेन्सेस](./doc/doc_en/reference_en.md) - [रेफरेन्सेस](../doc_en/reference_en.md)
- [लाइसेंस](#LICENSE) - [लाइसेंस](#LICENSE)
<a name="language_requests"></a> <a name="language_requests"></a>
...@@ -166,7 +166,7 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -166,7 +166,7 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
<a name="विसुमलाइजेशन"></a> <a name="विसुमलाइजेशन"></a>
## 👀 विज़ुअलाइज़ेशन [अधिक] (./doc/doc_en/visualization_en.md) ## 👀 विज़ुअलाइज़ेशन [अधिक] (../doc_en/visualization_en.md)
<details open> <details open>
<summary>PP-OCRv3 बहुभाषी मॉडल</summary> <summary>PP-OCRv3 बहुभाषी मॉडल</summary>
......
...@@ -20,37 +20,37 @@ PaddleOCR は、さまざまな言語で、優れた最先端かつ実用的な ...@@ -20,37 +20,37 @@ PaddleOCR は、さまざまな言語で、優れた最先端かつ実用的な
<div align="center"> <div align="center">
<img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800"> <img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800">
</div> </div>
<div align="center"> <div align="center">
<img src="./doc/imgs_results/PP-OCRv3/en/en_4.png" width="800"> <img src="../imgs_results/PP-OCRv3/en/en_4.png" width="800">
</div> </div>
<div align="center"> <div align="center">
<img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800"> <img src="../imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800">
</div> </div>
## 📣 最新アップデート ## 📣 最新アップデート
- **🔥2022.8.24 リリース PaddleOCR [release/2.6 ](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)** - **🔥2022.8.24 リリース PaddleOCR [release/2.6 ](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)**
- [PP-Structurev2](./ppstructure/)がリリース。機能と使いやすさがアップグレード、中国語のさまざまな文字に適応、 [レイアウトの復旧](./ppstructure/recovery) さらに**1 行のコマンドをPDFへ転換、そして Word**に変換可能。 - [PP-Structurev2](../../ppstructure/)がリリース。機能と使いやすさがアップグレード、中国語のさまざまな文字に適応、 [レイアウトの復旧](../../ppstructure/recovery) さらに**1 行のコマンドをPDFへ転換、そして Word**に変換可能。
- [レイアウト分析](./ppstructure/layout) の最適化:モデルのストレージが 95% 削減、速度が 11 倍向上、平均 CPU 時間コストはわずか 41 ミリ秒です。 - [レイアウト分析](../../ppstructure/layout) の最適化:モデルのストレージが 95% 削減、速度が 11 倍向上、平均 CPU 時間コストはわずか 41 ミリ秒です。
- [表認識](./ppstructure/table) 最適化:3つの最適化戦略設計、モデルの精度が従来より同時間比が 6% 向上。 - [表認識](../../ppstructure/table) 最適化:3つの最適化戦略設計、モデルの精度が従来より同時間比が 6% 向上。
- [キー情報抽出](./ppstructure/kie) 最適化:視覚に依存しないモデル構造設計、語彙の実態識別精度が 2.8% 向上、関係抽出の精度が 9.1% 向上。 - [キー情報抽出](../../ppstructure/kie) 最適化:視覚に依存しないモデル構造設計、語彙の実態識別精度が 2.8% 向上、関係抽出の精度が 9.1% 向上。
- **🔥2022.7 リリース [OCR scene application collection](./applications/README_en.md)** - **🔥2022.7 リリース [OCR scene application collection](../../applications/README_en.md)**
- デジタルチューブ、液晶画面、ナンバー プレート、手書き認識モデル、高精度 SVTR モデルなど、**9つの垂直モデル**をリリース、一般、製造、金融、運輸業界の主要な OCR 垂直アプリケーションをカバー。 - デジタルチューブ、液晶画面、ナンバー プレート、手書き認識モデル、高精度 SVTR モデルなど、**9つの垂直モデル**をリリース、一般、製造、金融、運輸業界の主要な OCR 垂直アプリケーションをカバー。
- **🔥2022.5.9 リリース PaddleOCR [release/2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)** - **🔥2022.5.9 リリース PaddleOCR [release/2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)**
- [PP-OCRv3](./doc/doc_en/ppocr_introduction_en.md#pp-ocrv3)リリース: 同等の速度で、中国語の識別効果は PP-OCRv2 より 5% 向上、英語の識別効果は 11% 向上し、80 言語の多言語モデルの平均認識精度は 5% 以上向上。 - [PP-OCRv3](../doc_en/ppocr_introduction_en.md#pp-ocrv3)リリース: 同等の速度で、中国語の識別効果は PP-OCRv2 より 5% 向上、英語の識別効果は 11% 向上し、80 言語の多言語モデルの平均認識精度は 5% 以上向上。
- [PPOCRLabelv2](./PPOCRLabel)リリース: 表認識タスク、キー情報抽出タスク、イレギュラーテキスト画像のアノテーション機能を追加。 - [PPOCRLabelv2](./PPOCRLabel)リリース: 表認識タスク、キー情報抽出タスク、イレギュラーテキスト画像のアノテーション機能を追加。
- インタラクティブな電子書籍 [*"OCR に没入"*](./doc/doc_en/ocr_book_en.md)、 をリリース。 OCRフルスタック技術の最先端の理論とコードの実践をカバー。 - インタラクティブな電子書籍 [*"OCR に没入"*](../doc_en/ocr_book_en.md)、 をリリース。 OCRフルスタック技術の最先端の理論とコードの実践をカバー。
- [もっと](./doc/doc_en/update_en.md) - [もっと](../doc_en/update_en.md)
## 🌟 PaddleOCRとは? ## 🌟 PaddleOCRとは?
PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムに対応する、産業用の機能モデル/ソリューション [PP-OCR](./doc/doc_en/ppocr_introduction_en.md)[PP-Structure](./ppstructure/README.md) を開発。これに基づき、データの生成、モデルのトレーニング、圧縮、推論、展開の全プロセスを実行可能。 PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムに対応する、産業用の機能モデル/ソリューション [PP-OCR](../doc_en/ppocr_introduction_en.md)[PP-Structure](../../ppstructure/README.md) を開発。これに基づき、データの生成、モデルのトレーニング、圧縮、推論、展開の全プロセスを実行可能。
<div align="center"> <div align="center">
<img src="https://user-images.githubusercontent.com/50011306/195771471-fad5eb1d-190d-4a7b-8b0c-0433fb32445f.png"> <img src="https://user-images.githubusercontent.com/50011306/195771471-fad5eb1d-190d-4a7b-8b0c-0433fb32445f.png">
...@@ -61,15 +61,15 @@ PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズム ...@@ -61,15 +61,15 @@ PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズム
```bash ```bash
pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr pip3 install paddleocr
paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr paddleocr --image_dir ../imgs_en/254.jpg --lang=en # change for i18n abbr
``` ```
>Python環境がない場合は [環境の準備](./doc/doc_en/environment_en.md)に従ってください。[チュートリアル](#Tutorials) から始めることをお勧めします。 >Python環境がない場合は [環境の準備](../doc_en/environment_en.md)に従ってください。[チュートリアル](#Tutorials) から始めることをお勧めします。
<a name="本"></a> <a name="本"></a>
## 📚 電子書籍:*OCRに入る* ## 📚 電子書籍:*OCRに入る*
- [OCRに没入](./doc/doc_en/ocr_book_en.md) - [OCRに没入](../doc_en/ocr_book_en.md)
<a name="コミュニティ"></a> <a name="コミュニティ"></a>
...@@ -88,70 +88,70 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -88,70 +88,70 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
| 中国語と英語の超軽量 PP-OCRv3 モデル(16.2M) | ch_PP-OCRv3_xx | モバイル & サーバー | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [推論モデル](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) | | 中国語と英語の超軽量 PP-OCRv3 モデル(16.2M) | ch_PP-OCRv3_xx | モバイル & サーバー | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [推論モデル](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) |
- その他のモデルのダウンロード (多言語を含む) については、[PP-OCR シリーズ モデルのダウンロード] (./doc/doc_en/models_list_en.md)をご参照ください。 - その他のモデルのダウンロード (多言語を含む) については、[PP-OCR シリーズ モデルのダウンロード] (../doc_en/models_list_en.md)をご参照ください。
- 新しい言語のリクエストについては、 [新しい言語_リクエストのガイドライン](#language_requests)を参照してください。 - 新しい言語のリクエストについては、 [新しい言語_リクエストのガイドライン](#language_requests)を参照してください。
- 構造文書分析モデルについては、[PP-Structure models](./ppstructure/docs/models_list_en.md)をご参照ください。 - 構造文書分析モデルについては、[PP-Structure models](../../ppstructure/docs/models_list_en.md)をご参照ください。
<a name="チュートリアル"></a> <a name="チュートリアル"></a>
## 📖 チュートリアル ## 📖 チュートリアル
- [環境の準備](./doc/doc_en/environment_en.md) - [環境の準備](../doc_en/environment_en.md)
- [PP-OCR 🔥](./doc/doc_en/ppocr_introduction_en.md) - [PP-OCR 🔥](../doc_en/ppocr_introduction_en.md)
- [クイックスタート](./doc/doc_en/quickstart_en.md) - [クイックスタート](../doc_en/quickstart_en.md)
- [Model Zoo](./doc/doc_en/models_en.md) - [Model Zoo](../doc_en/models_en.md)
- [トレーニング モデル](./doc/doc_en/training_en.md) - [トレーニング モデル](../doc_en/training_en.md)
- [テキスト検出](./doc/doc_en/detection_en.md) - [テキスト検出](../doc_en/detection_en.md)
- [テキスト認識](./doc/doc_en/recognition_en.md) - [テキスト認識](../doc_en/recognition_en.md)
- [テキスト方向の分類](./doc/doc_en/angle_class_en.md) - [テキスト方向の分類](../doc_en/angle_class_en.md)
- モデル圧縮 - モデル圧縮
- [モデルの量子化](./deploy/slim/quantization/README_en.md) - [モデルの量子化](./deploy/slim/quantization/README_en.md)
- [モデルの剪裁](./deploy/slim/prune/README_en.md) - [モデルの剪裁](./deploy/slim/prune/README_en.md)
- [知識の蒸留](./doc/doc_en/knowledge_distillation_en.md) - [知識の蒸留](../doc_en/knowledge_distillation_en.md)
- [推論と展開](./deploy/README.md) - [推論と展開](./deploy/README.md)
- [Python 推論](./doc/doc_en/inference_ppocr_en.md) - [Python 推論](../doc_en/inference_ppocr_en.md)
- [C++ 推論](./deploy/cpp_infer/readme.md) - [C++ 推論](./deploy/cpp_infer/readme.md)
- [サービング](./deploy/pdserving/README.md) - [サービング](./deploy/pdserving/README.md)
- [モバイル](./deploy/lite/readme.md) - [モバイル](./deploy/lite/readme.md)
- [Paddle2ONNX](./deploy/paddle2onnx/readme.md) - [Paddle2ONNX](./deploy/paddle2onnx/readme.md)
- [PaddleCloud](./deploy/paddlecloud/README.md) - [PaddleCloud](./deploy/paddlecloud/README.md)
- [Benchmark](./doc/doc_en/benchmark_en.md) - [Benchmark](../doc_en/benchmark_en.md)
- [PP-Structure 🔥](./ppstructure/README.md) - [PP-Structure 🔥](../../ppstructure/README.md)
- [クイックスタート](./ppstructure/docs/quickstart_en.md) - [クイックスタート](../../ppstructure/docs/quickstart_en.md)
- [Model Zoo](./ppstructure/docs/models_list_en.md) - [Model Zoo](../../ppstructure/docs/models_list_en.md)
- [トレーニング モデル](./doc/doc_en/training_en.md) - [トレーニング モデル](../doc_en/training_en.md)
- [レイアウト分析](./ppstructure/layout/README.md) - [レイアウト分析](../../ppstructure/layout/README.md)
- [表認識](./ppstructure/table/README.md) - [表認識](../../ppstructure/table/README.md)
- [キー情報抽出](./ppstructure/kie/README.md) - [キー情報抽出](../../ppstructure/kie/README.md)
- [推論と展開](./deploy/README.md) - [推論と展開](./deploy/README.md)
- [Python 推論](./ppstructure/docs/inference_en.md) - [Python 推論](../../ppstructure/docs/inference_en.md)
- [C++ 推論](./deploy/cpp_infer/readme.md) - [C++ 推論](./deploy/cpp_infer/readme.md)
- [サービング](./deploy/hubserving/readme_en.md) - [サービング](./deploy/hubserving/readme_en.md)
- [アカデミックアリゴリズム](./doc/doc_en/algorithm_overview_en.md) - [アカデミックアリゴリズム](../doc_en/algorithm_overview_en.md)
- [テキスト検出](./doc/doc_en/algorithm_overview_en.md) - [テキスト検出](../doc_en/algorithm_overview_en.md)
- [テキスト認識](./doc/doc_en/algorithm_overview_en.md) - [テキスト認識](../doc_en/algorithm_overview_en.md)
- [エンド・ツー・エンド OCR](./doc/doc_en/algorithm_overview_en.md) - [エンド・ツー・エンド OCR](../doc_en/algorithm_overview_en.md)
- [表認識](./doc/doc_en/algorithm_overview_en.md) - [表認識](../doc_en/algorithm_overview_en.md)
- [キー情報抽出](./doc/doc_en/algorithm_overview_en.md) - [キー情報抽出](../doc_en/algorithm_overview_en.md)
- [PaddleOCR に新しいアルゴリズムを追加する](./doc/doc_en/add_new_algorithm_en.md) - [PaddleOCR に新しいアルゴリズムを追加する](../doc_en/add_new_algorithm_en.md)
- データの注釈と合成 - データの注釈と合成
- [半自動注釈ツール: PPOCRLabel](./PPOCRLabel/README.md) - [半自動注釈ツール: PPOCRLabel](./PPOCRLabel/README.md)
- [データ合成ツール: Style-Text](./StyleText/README.md) - [データ合成ツール: Style-Text](./StyleText/README.md)
- [その他のデータ注釈ツール](./doc/doc_en/data_annotation_en.md) - [その他のデータ注釈ツール](../doc_en/data_annotation_en.md)
- [その他のデータ合成ツール](./doc/doc_en/data_synthesis_en.md) - [その他のデータ合成ツール](../doc_en/data_synthesis_en.md)
- データセット - データセット
- [一般OCRデータセット(中国語/英語)](doc/doc_en/dataset/datasets_en.md) - [一般OCRデータセット(中国語/英語)](../doc_en/dataset/datasets_en.md)
- [HandWritten_OCR_Datasets(中国語)](doc/doc_en/dataset/handwritten_datasets_en.md) - [HandWritten_OCR_Datasets(中国語)](../doc_en/dataset/handwritten_datasets_en.md)
- [各種OCRデータセット(多言語対応)](doc/doc_en/dataset/vertical_and_multilingual_datasets_en.md) - [各種OCRデータセット(多言語対応)](../doc_en/dataset/vertical_and_multilingual_datasets_en.md)
- [レイアウト分析](doc/doc_en/dataset/layout_datasets_en.md) - [レイアウト分析](../doc_en/dataset/layout_datasets_en.md)
- [表認識](doc/doc_en/dataset/table_datasets_en.md) - [表認識](../doc_en/dataset/table_datasets_en.md)
- [キー情報抽出](doc/doc_en/dataset/kie_datasets_en.md) - [キー情報抽出](../doc_en/dataset/kie_datasets_en.md)
- [コード構造](./doc/doc_en/tree_en.md) - [コード構造](../doc_en/tree_en.md)
- [視覚化](#Visualization) - [視覚化](#Visualization)
- [コミュニティ](#Community) - [コミュニティ](#Community)
- [新言語のリクエスト](#language_requests) - [新言語のリクエスト](#language_requests)
- [よくある質問](./doc/doc_en/FAQ_en.md) - [よくある質問](../doc_en/FAQ_en.md)
- [参考文献](./doc/doc_en/reference_en.md) - [参考文献](../doc_en/reference_en.md)
- [ライセンス](#LICENSE) - [ライセンス](#LICENSE)
<a name="language_requests"></a> <a name="language_requests"></a>
...@@ -166,29 +166,29 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -166,29 +166,29 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
<a name="ビジュアリゼーション"></a> <a name="ビジュアリゼーション"></a>
## 👀 ビジュアリゼーション [more](./doc/doc_en/visualization_en.md) ## 👀 ビジュアリゼーション [more](../doc_en/visualization_en.md)
<details open> <details open>
<summary>PP-OCRv3 多言語モデル</summary> <summary>PP-OCRv3 多言語モデル</summary>
<div align="center"> <div align="center">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800">
</div> </div>
</details> </details>
<details open> <details open>
<summary>PP-OCRv3 英語 モデル</summary> <summary>PP-OCRv3 英語 モデル</summary>
<div align="center"> <div align="center">
<img src="doc/imgs_results/PP-OCRv3/en/en_1.png" width="800"> <img src="../imgs_results/PP-OCRv3/en/en_1.png" width="800">
<img src="doc/imgs_results/PP-OCRv3/en/en_2.png" width="800"> <img src="../imgs_results/PP-OCRv3/en/en_2.png" width="800">
</div> </div>
</details> </details>
<details open> <details open>
<summary>PP-OCRv3 中国語 モデル</summary> <summary>PP-OCRv3 中国語 モデル</summary>
<div align="center"> <div align="center">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800">
</div> </div>
</details> </details>
...@@ -196,7 +196,7 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -196,7 +196,7 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
<summary>PP-Structurev2</summary> <summary>PP-Structurev2</summary>
1. レイアウト分析+テーブル認識 1. レイアウト分析+テーブル認識
<div align="center"> <div align="center">
<img src="./ppstructure/docs/table/ppstructure.GIF" width="800"> <img src="../../ppstructure/docs/table/ppstructure.GIF" width="800">
</div> </div>
2. SER (セマンティックエンティティ認識) 2. SER (セマンティックエンティティ認識)
<div align="center"> <div align="center">
...@@ -219,6 +219,7 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -219,6 +219,7 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
<img src="https://user-images.githubusercontent.com/14270174/185540080-0431e006-9235-4b6d-b63d-0b3c6e1de48f.jpg" width="600"> <img src="https://user-images.githubusercontent.com/14270174/185540080-0431e006-9235-4b6d-b63d-0b3c6e1de48f.jpg" width="600">
</div> </div>
</details> </details>
<a name="ライセンス"></a> <a name="ライセンス"></a>
## 📄 ライセンス ## 📄 ライセンス
......
...@@ -19,36 +19,36 @@ PaddleOCR은 사용자들이 보다 나은 모델을 훈련하여 실전에 투 ...@@ -19,36 +19,36 @@ PaddleOCR은 사용자들이 보다 나은 모델을 훈련하여 실전에 투
<div align="center"> <div align="center">
<img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800"> <img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800">
</div> </div>
<div align="center"> <div align="center">
<img src="./doc/imgs_results/PP-OCRv3/en/en_4.png" width="800"> <img src="../imgs_results/PP-OCRv3/en/en_4.png" width="800">
</div> </div>
<div align="center"> <div align="center">
<img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800"> <img src="../imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800">
</div> </div>
## 📣최근 업데이트 ## 📣최근 업데이트
- **🔥2022년 8월 24일에 패들 OCR 출시 [출시/2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)** - **🔥2022년 8월 24일에 패들 OCR 출시 [출시/2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)**
차이니즈 씬에 맞춘 완전 업그레이드 된 기능과 성능을 갖춘 ; [PP-Structurev2](./ppstructure/) 출시, 그리고 레이아웃 리커버리 ](./ppstructure/recovery) 신규 지원 및 PDF 를 워드로 전환하는 원 라인 명령 차이니즈 씬에 맞춘 완전 업그레이드 된 기능과 성능을 갖춘 ; [PP-Structurev2](../../ppstructure/) 출시, 그리고 레이아웃 리커버리 ](../../ppstructure/recovery) 신규 지원 및 PDF 를 워드로 전환하는 원 라인 명령
- [레이아웃 분석](./ppstructure/layout) 최적화: 95% 감소된 모델 저장, while 반면 속도는 11배 증가하고, 평균 CPU 시간 비용은 41ms에 불과함; - [레이아웃 분석](../../ppstructure/layout) 최적화: 95% 감소된 모델 저장, while 반면 속도는 11배 증가하고, 평균 CPU 시간 비용은 41ms에 불과함;
- [표 인식](./ppstructure/table) 최적화: 3 최적화 전략이 디자인되고 모델 정확도는 비교 가능한 시간 소비 하에 6% 개선됨; - [표 인식](../../ppstructure/table) 최적화: 3 최적화 전략이 디자인되고 모델 정확도는 비교 가능한 시간 소비 하에 6% 개선됨;
- [핵심 정보 추출](./ppstructure/kie) 최적화: 시각에 의존하지 않는 모델 구조가 디자인되고, 의미체 인식 정확도가 2.8% 증가되며 관계 추출 정확도는 9.1% 증가됨. - [핵심 정보 추출](../../ppstructure/kie) 최적화: 시각에 의존하지 않는 모델 구조가 디자인되고, 의미체 인식 정확도가 2.8% 증가되며 관계 추출 정확도는 9.1% 증가됨.
- **🔥2022년 7월 출시[OCR 씬 애플리케이션 컬렉션](./applications/README_en.md)** - **🔥2022년 7월 출시[OCR 씬 애플리케이션 컬렉션](../../applications/README_en.md)**
디지털 튜브, LCD 스크린, 라이선스 플레이트, 수기 인식 모델, 고정밀 SVTR 모델 등등과 같은 “9수직 모델” 출시로, 일반적으로 주된 OCR 수직 애플리케이션, 제조, 금융 및 수송 산업 커버 디지털 튜브, LCD 스크린, 라이선스 플레이트, 수기 인식 모델, 고정밀 SVTR 모델 등등과 같은 “9수직 모델” 출시로, 일반적으로 주된 OCR 수직 애플리케이션, 제조, 금융 및 수송 산업 커버
- **🔥2022년 5월 9일에 패들 OCR 출시 [출시/2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)** - **🔥2022년 5월 9일에 패들 OCR 출시 [출시/2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)**
- [PP-OCRv3](./doc/doc_en/ppocr_introduction_en.md#pp-ocrv3)출시: 5%.비교 가능한 속도로, 차이니즈 씬의 효과는 PP-OCRv2와 비교해 볼 때 추가로 5% 정도 더 개선되고, 잉글리쉬 씬 효과는 11% 개선되었으며, 80개 언어 다중 언어 모델 평균 인식 정확도는 5% 이상 개선됨. - [PP-OCRv3](../doc_en/ppocr_introduction_en.md#pp-ocrv3)출시: 5%.비교 가능한 속도로, 차이니즈 씬의 효과는 PP-OCRv2와 비교해 볼 때 추가로 5% 정도 더 개선되고, 잉글리쉬 씬 효과는 11% 개선되었으며, 80개 언어 다중 언어 모델 평균 인식 정확도는 5% 이상 개선됨.
- [PPOCRLabelv2](./PPOCRLabel)출시: 표 인식 업무, 핵심 정보 추출 업무 및 불규칙한 텍스트 이미지주석 기능 추가. - [PPOCRLabelv2](./PPOCRLabel)출시: 표 인식 업무, 핵심 정보 추출 업무 및 불규칙한 텍스트 이미지주석 기능 추가.
- 쌍방향e-북 출시 [*"OCR 뛰어들기"*](./doc/doc_en/ocr_book_en.md), 첨단 이론 및 OCR 정식 스택 기술 코드 연습 포함. - 쌍방향e-북 출시 [*"OCR 뛰어들기"*](../doc_en/ocr_book_en.md), 첨단 이론 및 OCR 정식 스택 기술 코드 연습 포함.
- [추가](./doc/doc_en/update_en.md) - [추가](../doc_en/update_en.md)
## 🌟특징 ## 🌟특징
패들OCR은 OCR 관련 다양한 첨단 알고리즘 지원 [PP-OCR](./doc/doc_en/ppocr_introduction_en.md)[PP-Structure](./ppstructure/README.md) 이를 기반으로, 그리고 전체 데이터 생산 처리, 모델 훈련, 압축, 추론 및 배치를 통해 획득. 패들OCR은 OCR 관련 다양한 첨단 알고리즘 지원 [PP-OCR](../doc_en/ppocr_introduction_en.md)[PP-Structure](../../ppstructure/README.md) 이를 기반으로, 그리고 전체 데이터 생산 처리, 모델 훈련, 압축, 추론 및 배치를 통해 획득.
<div align="center"> <div align="center">
<img src="https://user-images.githubusercontent.com/50011306/195770559-1f107881-d821-4426-90cd-fe81b9ae78e7.png"> <img src="https://user-images.githubusercontent.com/50011306/195770559-1f107881-d821-4426-90cd-fe81b9ae78e7.png">
...@@ -62,12 +62,12 @@ pip3 install paddleocr ...@@ -62,12 +62,12 @@ pip3 install paddleocr
paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
``` ```
>만일 당신이 파이톤 환경이 없다면 [환경 준비]를 따르기 바람(./doc/doc_en/environment_en.md). 우리는 당신이[사용지침 프로그램]으로 시작할 것을 권장합니다.(#Tutorials). >만일 당신이 파이톤 환경이 없다면 [환경 준비]를 따르기 바람(../doc_en/environment_en.md). 우리는 당신이[사용지침 프로그램]으로 시작할 것을 권장합니다.(#Tutorials).
<a name="북"></a> <a name="북"></a>
## 📚 E-북: *OCR로 뛰어들기* ## 📚 E-북: *OCR로 뛰어들기*
- [OCR로 뛰어들기](./doc/doc_en/ocr_book_en.md) - [OCR로 뛰어들기](../doc_en/ocr_book_en.md)
<a name="커뮤니티"></a> <a name="커뮤니티"></a>
...@@ -86,70 +86,70 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -86,70 +86,70 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
| 중국어 및 영어 초경량 PP-OCRv3 model(16.2M) | ch_PP-OCRv3_xx | 모바일 & 서버 | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [추론 모델](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) | | 중국어 및 영어 초경량 PP-OCRv3 model(16.2M) | ch_PP-OCRv3_xx | 모바일 & 서버 | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [추론 모델](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) |
- (다중 언어를 포함하여)더 많은 모델을 다운로드 하려면, [PP-OCR 시리즈 모델 다운로드](doc/doc_en/models_list_en.md)를 참조할 것. - (다중 언어를 포함하여)더 많은 모델을 다운로드 하려면, [PP-OCR 시리즈 모델 다운로드](../doc_en/models_list_en.md)를 참조할 것.
- 신규 언어 요청에 대해서는, [신규 언어 요청 지침](#language_requests)을 참조할 것. - 신규 언어 요청에 대해서는, [신규 언어 요청 지침](#language_requests)을 참조할 것.
- 구조적 문서 분석 모델에 대해서는, [PP-Structure models](./ppstructure/docs/models_list_en.md).을 참조할 것. - 구조적 문서 분석 모델에 대해서는, [PP-Structure models](../../ppstructure/docs/models_list_en.md).을 참조할 것.
<a name="사용 지침 프로그램"></a> <a name="사용 지침 프로그램"></a>
## 📖 사용 지침 프로그램 ## 📖 사용 지침 프로그램
- [환경 준비](./doc/doc_en/environment_en.md) - [환경 준비](../doc_en/environment_en.md)
- [PP-OCR 🔥](./doc/doc_en/ppocr_introduction_en.md) - [PP-OCR 🔥](../doc_en/ppocr_introduction_en.md)
- [신속한 시작](./doc/doc_en/quickstart_en.md) - [신속한 시작](../doc_en/quickstart_en.md)
- [동물원 모델](./doc/doc_en/models_en.md) - [동물원 모델](../doc_en/models_en.md)
- [모델 훈련](./doc/doc_en/training_en.md) - [모델 훈련](../doc_en/training_en.md)
- [텍스트 감지](./doc/doc_en/detection_en.md) - [텍스트 감지](../doc_en/detection_en.md)
- [텍스트 인식](./doc/doc_en/recognition_en.md) - [텍스트 인식](../doc_en/recognition_en.md)
- [텍스트 방향 분류](./doc/doc_en/angle_class_en.md) - [텍스트 방향 분류](../doc_en/angle_class_en.md)
- 모델 압축 - 모델 압축
- [모델 계량화](./deploy/slim/quantization/README_en.md) - [모델 계량화](./deploy/slim/quantization/README_en.md)
- [모델 전지작업](./deploy/slim/prune/README_en.md) - [모델 전지작업](./deploy/slim/prune/README_en.md)
- [지식 정제](./doc/doc_en/knowledge_distillation_en.md) - [지식 정제](../doc_en/knowledge_distillation_en.md)
- [추론 및 배치](./deploy/README.md) - [추론 및 배치](./deploy/README.md)
- [파이톤 추론](./doc/doc_en/inference_ppocr_en.md) - [파이톤 추론](../doc_en/inference_ppocr_en.md)
- [C++ 추론](./deploy/cpp_infer/readme.md) - [C++ 추론](./deploy/cpp_infer/readme.md)
- [서빙](./deploy/pdserving/README.md) - [서빙](./deploy/pdserving/README.md)
- [모바일](./deploy/lite/readme.md) - [모바일](./deploy/lite/readme.md)
- [Paddle2ONNX](./deploy/paddle2onnx/readme.md) - [Paddle2ONNX](./deploy/paddle2onnx/readme.md)
- [패들 클라우드](./deploy/paddlecloud/README.md) - [패들 클라우드](./deploy/paddlecloud/README.md)
- [Benchmark](./doc/doc_en/benchmark_en.md) - [Benchmark](../doc_en/benchmark_en.md)
- [PP-Structure 🔥](./ppstructure/README.md) - [PP-Structure 🔥](../../ppstructure/README.md)
- [신속한 시작](./ppstructure/docs/quickstart_en.md) - [신속한 시작](../../ppstructure/docs/quickstart_en.md)
- [동물원 모델](./ppstructure/docs/models_list_en.md) - [동물원 모델](../../ppstructure/docs/models_list_en.md)
- [모델 훈련](./doc/doc_en/training_en.md) - [모델 훈련](../doc_en/training_en.md)
- [레이아웃 분석](./ppstructure/layout/README.md) - [레이아웃 분석](../../ppstructure/layout/README.md)
- [표 인식](./ppstructure/table/README.md) - [표 인식](../../ppstructure/table/README.md)
- [핵심 정보 추출](./ppstructure/kie/README.md) - [핵심 정보 추출](../../ppstructure/kie/README.md)
- [추론 및 배치](./deploy/README.md) - [추론 및 배치](./deploy/README.md)
- [파이톤 추론](./ppstructure/docs/inference_en.md) - [파이톤 추론](../../ppstructure/docs/inference_en.md)
- [C++ 추론](./deploy/cpp_infer/readme.md) - [C++ 추론](./deploy/cpp_infer/readme.md)
- [서빙](./deploy/hubserving/readme_en.md) - [서빙](./deploy/hubserving/readme_en.md)
- [학문적 알고리즘](./doc/doc_en/algorithm_overview_en.md) - [학문적 알고리즘](../doc_en/algorithm_overview_en.md)
- [텍스트 감지](./doc/doc_en/algorithm_overview_en.md) - [텍스트 감지](../doc_en/algorithm_overview_en.md)
- [텍스트 인식](./doc/doc_en/algorithm_overview_en.md) - [텍스트 인식](../doc_en/algorithm_overview_en.md)
- [종단종OCR](./doc/doc_en/algorithm_overview_en.md) - [종단종OCR](../doc_en/algorithm_overview_en.md)
- [표 인식](./doc/doc_en/algorithm_overview_en.md) - [표 인식](../doc_en/algorithm_overview_en.md)
- [핵심 정보 추출](./doc/doc_en/algorithm_overview_en.md) - [핵심 정보 추출](../doc_en/algorithm_overview_en.md)
- [PaddleOCR에 신규 알고리즘 추가](./doc/doc_en/add_new_algorithm_en.md) - [PaddleOCR에 신규 알고리즘 추가](../doc_en/add_new_algorithm_en.md)
- 데이터 주석 및 합성 - 데이터 주석 및 합성
- [반-자동 주석 툴: PPOCRLabel](./PPOCRLabel/README.md) - [반-자동 주석 툴: PPOCRLabel](./PPOCRLabel/README.md)
- [데이터 합성 툴: 스타일-텍스트](./StyleText/README.md) - [데이터 합성 툴: 스타일-텍스트](./StyleText/README.md)
- [기타 데이터 주석 툴](./doc/doc_en/data_annotation_en.md) - [기타 데이터 주석 툴](../doc_en/data_annotation_en.md)
- [기타 데이터 합성 툴](./doc/doc_en/data_synthesis_en.md) - [기타 데이터 합성 툴](../doc_en/data_synthesis_en.md)
- 데이터세트 - 데이터세트
- [일반 OCR 데이터세트(중국어/영어)](doc/doc_en/dataset/datasets_en.md) - [일반 OCR 데이터세트(중국어/영어)](../doc_en/dataset/datasets_en.md)
- [수기_OCR_데이터세트(중국어)](doc/doc_en/dataset/handwritten_datasets_en.md) - [수기_OCR_데이터세트(중국어)](../doc_en/dataset/handwritten_datasets_en.md)
- [다양한 OCR 데이터세트(다중언어)](doc/doc_en/dataset/vertical_and_multilingual_datasets_en.md) - [다양한 OCR 데이터세트(다중언어)](../doc_en/dataset/vertical_and_multilingual_datasets_en.md)
- [레이아웃 분석](doc/doc_en/dataset/layout_datasets_en.md) - [레이아웃 분석](../doc_en/dataset/layout_datasets_en.md)
- [표 인식](doc/doc_en/dataset/table_datasets_en.md) - [표 인식](../doc_en/dataset/table_datasets_en.md)
- [핵심 정보 추출](doc/doc_en/dataset/kie_datasets_en.md) - [핵심 정보 추출](../doc_en/dataset/kie_datasets_en.md)
- [코드 구조](./doc/doc_en/tree_en.md) - [코드 구조](../doc_en/tree_en.md)
- [시각화](#Visualization) - [시각화](#Visualization)
- [커뮤니티](#Community) - [커뮤니티](#Community)
- [신규 언어 요청](#language_requests) - [신규 언어 요청](#language_requests)
- [자주 묻는 질문](./doc/doc_en/FAQ_en.md) - [자주 묻는 질문](../doc_en/FAQ_en.md)
- [추론](./doc/doc_en/reference_en.md) - [추론](../doc_en/reference_en.md)
- [라이선스](#LICENSE) - [라이선스](#LICENSE)
<a name="language_requests"></a> <a name="language_requests"></a>
...@@ -162,16 +162,17 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr ...@@ -162,16 +162,17 @@ paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
<a name="시각화"></a> <a name="시각화"></a>
## 👀 시각화[추가](./doc/doc_en/visualization_en.md) ## 👀 시각화[추가](../doc_en/visualization_en.md)
<details open> <details open>
<summary>PP-OCRv3 다중 언어 모델</summary> <summary>PP-OCRv3 다중 언어 모델</summary>
<div align="center"> <div align="center">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800"> <img src="../imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800">
</div> </div>
</details> </details>
<details open> <details open>
<summary>PP-OCRv3 영어 모델</summary> <summary>PP-OCRv3 영어 모델</summary>
<div align="center"> <div align="center">
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册