提交 4c4468ba 编写于 作者: qq_25193841's avatar qq_25193841

Add i18n readme

Add i18n readme
上级 2605b1c0
English| [简体中文](README_ch.md)
<p align="center">
<img src="./doc/PaddleOCR_log.png" align="middle" width = "600"/>
<p align="center">
<p align="left">
<a href="./LICENSE"><img src="https://img.shields.io/badge/license-Apache%202-dfd.svg"></a>
<a href="https://github.com/PaddlePaddle/PaddleOCR/releases"><img src="https://img.shields.io/github/v/release/PaddlePaddle/PaddleOCR?color=ffa"></a>
<a href=""><img src="https://img.shields.io/badge/python-3.7+-aff.svg"></a>
<a href=""><img src="https://img.shields.io/badge/os-linux%2C%20win%2C%20mac-pink.svg"></a>
<a href=""><img src="https://img.shields.io/pypi/format/PaddleOCR?color=c77"></a>
<a href="https://pypi.org/project/PaddleOCR/"><img src="https://img.shields.io/pypi/dm/PaddleOCR?color=9cf"></a>
<a href="https://github.com/PaddlePaddle/PaddleOCR/stargazers"><img src="https://img.shields.io/github/stars/PaddlePaddle/PaddleOCR?color=ccf"></a>
</p>
## المقدمة
يهدف PaddleOCR إلى إنشاء أدوات OCR متعددة اللغات، رائعة، رائدة وعملية تساعد المستخدمين على التدرب على أفضل النماذج وتطبيقها في الحياة العملية.
<div align="center">
<img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800">
</div>
<div align="center">
<img src="./doc/imgs_results/PP-OCRv3/en/en_4.png" width="800">
</div>
<div align="center">
<img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800">
</div>
## 📣 آخر التحديثات
- **🔥- **2022.8.24 الإصدار PaddleOCR [الإصدار/2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)**
-إصدار [PP-Structurev2](./ppstructure/)مع الوظائف والأداء الذي تمت تحسينه بالكامل، وتكييفه مع الجانب الصيني، ودعم جديد لـ [استعادة التخطيط(./ppstructure/recovery)[و ** أمر سطر واحد لتحويل PDF إلى .**Word
] - تحليل التخطيط (./ppstructure/layout)[التحسين: تم تقليل تخزين النموذج بنسبة 95%، بينما زادت السرعة بمقدار 11 مرة، ويبلغ متوسط تكلفة وقت وحدة المعالجة المركزية 41 مللي ثانية فقط.
]- التعرف على الجدول (./ppstructure/table)[التحسين: تم تصميم 3 استراتيجيات للتحسين، وتم تحسين دقة النموذج بنسبة 6% في ظل استهلاك الوقت المماثل .
] - استخراج المعلومات الأساسية (./ppstructure/kie)[التحسين - تم تصميم هيكل نموذج بصري مستقل، وزيادة دقة التعرف على الكيانات الدلالية بنسبة 2.8%، وزيادة دقة استخراج العلاقة بنسبة %9.1
-- ** 🔥 **2022.7 الإصدار [مجموعة تطبيقات OCR المشهد] (./applications/README_en.md)
-الإصدار ** 9 نماذج رأسية ** مثل الأنبوب الرقمي وشاشة LCD ولوحة الترخيص ونموذج التعرف على خط اليد ونموذج SVTR عالي الدقة وما إلى ذلك ،OCR والتي تغطي التطبيقات الرأسية للتعرف المرئي على الحروف بشكل عام والتصنيع والتمويل والنقل.
2022.5.9 إصدار PaddleOCR [إصدار/2.5]
- **- ** [الإصدار/2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)**
-إصدار: [PP-OCRv3](./doc/doc_en/ppocr_introduction_en.md#pp-ocrv3) مع سرعة مماثلة، تم تحسين تأثير الجانب الصيني بنسبة 5% مقارنة بـ PP-OCRv2 ، وتم تحسين تأثير المشهد الإنجليزي بنسبة 11% وتم تحسين متوسط دقة التعرف على 80 نموذجًا متعدد اللغات بأكثر من %5.
-إصدار: [PPOCRLabelv2](./PPOCRLabel) أضف وظيفة التعليق التوضيحي لمهمة التعرف على الجدول، مهمة استخراج المعلومات الأساسية وصورة نصية غير منتظمة.
-إصدار كتاب إلكتروني تفاعلي [* "OCRالتعمق في التعرف المرئي على الحروف [* " (./doc/doc_en/ocr_book_en.md), يغطي أحدث النظريات وممارسات الكود لتقنية التعرف المرئي على الحروف الكاملة.
]- المزيد (./doc/doc_en/update_en.md)[
## 🌟 سمات
يدعم PaddleOCR مجموعة متنوعة من الخوارزميات المتطورة المتعلقة باOCR لتعرف المرئي على الحروف،
ونماذج/ حلول صناعية مميزة متطورة[PP-OCR](./doc/doc_en/ppocr_introduction_en.md) و [PP-Structure](./ppstructure/README.md)
على هذا الأساس، واجتياز العملية الكاملة لإنتاج البيانات، تدريب النموذج، الضغط، الاستدلال ، والنشر.
<div align="center">
<img src="https://user-images.githubusercontent.com/50011306/195772420-1ff9fc48-5bf3-4715-98da-375d96f584d7.png">
</div>
## ⚡ تجربة سريعة
```bash
pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
```
< إذا لم يكن لديك بيئة بايثون، فيرجى اتباع [تحضير البيئة (./doc/doc_en/environment_en.md).[
نوصيك بالبدء بـ [دروس تعليمية (#Tutorials)[
<a name="كتاب"></a>
## 📚 الكتاب الإلكتروني: * الغوص في OCR
- التعمق في التعرف المرئي على الحروف [OCR](./doc/doc_en/ocr_book_en.md)
<a name="المجتمع"></a>
## 👫 المجتمع
للمطورين الدوليين، نحن نحترم [مناقشات [Paddle OCR (https://github.com/PaddlePaddle/PaddleOCR/discussions) كمنصة للمجتمع الدولي. يمكن مناقشة جميع الأفكار والأسئلة هنا باللغة الإنجليزية.
<a name="قائمة النموذج الصيني المدعومة"></a>
## 🛠️ PP-OCR سلسلة قائمة النماذج
مقدمة نموذجية | | اسم الموديل | المشهد الموصى بها | نموذج الكشف | مصنف الاتجاه || نموذج الاعتراف ------------------------------------------------------------ | ---------------------------- | ----------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ || نماذج i18n | نموذج I18n | | المحمول والخادم | | || الإنجليزية خفيفة الوزن للغاية PP-OCRv3 نموذج (13.4M) | en_PP-OCRv3_xx | | المحمول والخادم [نموذج الاستدلال] (https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar) / [نموذج مدرب] (https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_distill_train.tar) | [نموذج الاستدلال] https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar / [نموذج مدرب] https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar | [نموذج الاستدلال] (https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_infer.tar) / [نموذج مدرب] (https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar) |
| الصينية والإنجليزية خفيفة الوزن للغاية PP-OCRv3 نموذج (16.2M) | ch_PP-OCRv3_xx | | المحمول والخادم [نموذج الاستدلال] (https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [نموذج مدرب] (https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [نموذج الاستدلال] https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar / [نموذج مدرب] https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar | [نموذج الاستدلال] (https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [نموذج مدرب] (https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar |
- لمزيد من تنزيلات النماذج (بما في ذلك لغات متعددة) ، يرجى الرجوع إلى [تنزيلات نموذج سلسلة PP-OCR] (./doc/doc_en/models_list_en.md).
- للحصول على طلب لغة جديد، يرجى الرجوع إلى [مبادئ توجيهية لطلبات_اللغات الجديدة(#language_requests).
- بالنسبة لنماذج تحليل المستندات الهيكلية، يرجى الرجوع إلى[PP-Structure] models](./ppstructure/docs/models_list_en.md).
<a name="التعليمية"></a>
## 📖 الدروس
- تحضيرالبيئة [PP-OCR](./doc/doc_en/environment_en.md)[
] - بداية سريعة(./doc/doc_en/quickstart_en.md)[
] - نموذج حديقة الحيوان(./doc/doc_en/models_en.md)[
] - تدريب نموذجي(./doc/doc_en/training_en.md)[
] - كشف النص[(./doc/doc_en/detection_en.md)[
] - التعرف على النص(./doc/doc_en/recognition_en.md)[
] - تصنيف اتجاه النص(./doc/doc_en/angle_class_en.md)[
-ضغط النموذج
] - نموذج توضيحي(./deploy/slim/quantization/README_en.md)]
- نموذج التهذيب(./deploy/slim/prune/README_en.md)]
] - تقطيرالمعرفة(./doc/doc_en/knowledge_distillation_en.md)[
] - الاستدلال والنشر(./deploy/README.md)[
] - استدلال بايثون(./doc/doc_en/inference_ppocr_en.md)[
] - استدلال(./deploy/cpp_infer/readme.md)[ C++
] -خدمة (./deploy/pdserving/README.md)[
] - هاتف محمول(./deploy/lite/readme.md)[
- [Paddle2ONNX](./deploy/paddle2onnx/readme.md)
- [PaddleCloud](./deploy/paddlecloud/README.md)
- [Benchmark](./doc/doc_en/benchmark_en.md)
- [PP-Structure
] - بداية سريعة(./ppstructure/docs/quickstart_en.md)[
] - نموذج حديقة الحيوان(./ppstructure/docs/models_list_en.md)[
] - تدريب نموذجي(./doc/doc_en/training_en.md)[
] - تحليل التخطيط(./ppstructure/layout/README.md)[
] - التعرف على الجدول(./ppstructure/table/README.md)[
] - استخراج المعلومات الأساسية(./ppstructure/kie/README.md)[
] - الاستدلال والنشر(./deploy/README.md)[
] - استدلال بايثون(./ppstructure/docs/inference_en.md)[
] - استدلال(./deploy/cpp_infer/readme.md)[ C++
] - خدمة(./deploy/hubserving/readme_en.md)[
] - الخوارزميات الأكاديمية(./doc/doc_en/algorithm_overview_en.md)[
] - كشف النص(./doc/doc_en/algorithm_overview_en.md)[
] - التعرف على النص(./doc/doc_en/algorithm_overview_en.md)[
] - التعرف المرئي على الحروف من طرف إلى طرف[
(./doc/doc_en/algorithm_overview_en.md)
] - التعرف على الجدول(./doc/doc_en/algorithm_overview_en.md)[
] - استخراج المعلومات الأساسية(./doc/doc_en/algorithm_overview_en.md) [
] - أضف خوارزميات جديدة إلى [PaddleOCR (./doc/doc_en/add_new_algorithm_en.md)
-شرح البيانات والتأليف
] - أداة التعليقات التوضيحية شبه الآلية: [PPOCRLabel (./PPOCRLabel/README.md)
] - أداة تجميع البيانات: نمط النص(./StyleText/README.md)[
] - أدوات شرح البيانات الأخرى(./doc/doc_en/data_annotation_en.md)[
] - أدوات تجميع البيانات الأخرى(./doc/doc_en/data_synthesis_en.md)[
-مجموعات البيانات
] - مجموعات بيانات التعرف البصري على الحروف العامة OCR(الصينية/ الإنجليزية) [
(doc/doc_en/dataset/datasets_en.md)
] - مجموعات البيانات المكتوبة بخط اليد _التعرف البصري على الحروف OCR_ (الصينية(
(doc/doc_en/dataset/handwritten_datasets_en.md)
] - مجموعات بيانات التعرف البصري على الحروف المختلفة OCR (متعددة اللغات [(
(doc/doc_en/dataset/vertical_and_multilingual_datasets_en.md)
] - تحليل التخطيط(doc/doc_en/dataset/layout_datasets_en.md)[
] - التعرف على الجدول(doc/doc_en/dataset/table_datasets_en.md)[
] - استخراج المعلومات الأساسية(doc/doc_en/dataset/kie_datasets_en.md)[
]- بنيةالكود(./doc/doc_en/tree_en.md)[
]- المرئيات(#Visualization)[
]- المجتمع(#Community)[
]- طلبات لغة جديدة(#language_requests)[
]- الأسئلة الشائعة(./doc/doc_en/FAQ_en.md)[
- ]المراجع(./doc/doc_en/reference_en.md)[
]- الترخيص(#LICENSE)[
<a name="language_requests"></a>
un ## إرشادات لطلبات اللغات الجديدة
إذا كنت ترغب في **طلب نموذج لغة جديد**، يرجى التصويت في [التصويت لصالح ترقيات النماذج متعددة اللغات] (https://github.com/PaddlePaddle/PaddleOCR/discussions/7253). سنقوم بترقية النموذج وفقا للنتيجة بانتظام. ** قم بدعوة أصدقائك للتصويت معا!**
إذا كنت بحاجة إلى ** تدريب نموذج لغة جديد ** بناء على السيناريو الخاص بك ، فإن البرنامج التعليمي في [مشروع تدريب نموذجي متعدد اللغات] (https://github.com/PaddlePaddle/PaddleOCR/discussions/7252) سيساعدك على إعداد مجموعة البيانات ويوضح لك العملية برمتها خطوة بخطوة .
[خطة تطويرOCR التعرف الضوئي على الحروف متعددة اللغات] الأصلية (https://github.com/PaddlePaddle/PaddleOCR/issues/1048) تعرض لك الكثير من المتن والقواميس المفيدة
<a name="المرئيات"></a>
## 👀 التصور [المزيد] (./doc/doc_en/visualization_en.md)
<details open>
<summary> 3 النموذج متعدد اللغات</summary> PP-OCRv
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800">
</div>
</details>
<details open>
<summary> النموذج الإنجليزي</summary> PP-OCRv3
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/en/en_1.png" width="800">
<img src="doc/imgs_results/PP-OCRv3/en/en_2.png" width="800">
</div>
</details>
<details open>
<summary> النموذج الصيني</summary> PP-OCRv3
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800">
</div>
</details>
<details open>
<summary>PP-Structurev2</summary>
1.تحليل التخطيط + التعرف على الجدول
<div align="center">
<img src="./ppstructure/docs/table/ppstructure.GIF" width="800">
</div>
2. SER التعرف على الكيان المتعلق بدلالات الألفاظ
<div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186094456-01a1dd11-1433-4437-9ab2-6480ac94ec0a.png" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185310636-6ce02f7c-790d-479f-b163-ea97a5a04808.jpg" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185539517-ccf2372a-f026-4a7c-ad28-c741c770f60a.png" width="600">
</div>
RE.3 استخراج العلاقة
<div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186094813-3a8e16cc-42e5-4982-b9f4-0134dfb5688d.png" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185393805-c67ff571-cf7e-4217-a4b0-8b396c4f22bb.jpg" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185540080-0431e006-9235-4b6d-b63d-0b3c6e1de48f.jpg" width="600">
</div>
</details>
<a name="ترخيص"></a>
## 📄 الترخيص
تم تحرير هذا المشروع تحت <a href="https://github.com/PaddlePaddle/PaddleOCR/blob/master/LICENSE">Apache 2.0 license</a>
English | [简体中文](README_ch.md)
<p align="center">
<img src="./doc/PaddleOCR_log.png" align="middle" width = "600"/>
<p align="center">
<p align="left">
<a href="./LICENSE"><img src="https://img.shields.io/badge/license-Apache%202-dfd.svg"></a>
<a href="https://github.com/PaddlePaddle/PaddleOCR/releases"><img src="https://img.shields.io/github/v/release/PaddlePaddle/PaddleOCR?color=ffa"></a>
<a href=""><img src="https://img.shields.io/badge/python-3.7+-aff.svg"></a>
<a href=""><img src="https://img.shields.io/badge/os-linux%2C%20win%2C%20mac-pink.svg"></a>
<a href=""><img src="https://img.shields.io/pypi/format/PaddleOCR?color=c77"></a>
<a href="https://pypi.org/project/PaddleOCR/"><img src="https://img.shields.io/pypi/dm/PaddleOCR?color=9cf"></a>
<a href="https://github.com/PaddlePaddle/PaddleOCR/stargazers"><img src="https://img.shields.io/github/stars/PaddlePaddle/PaddleOCR?color=ccf"></a>
</p>
## Введение
PaddleOCR стремится создавать многоязычные, потрясающие, передовые и практичные инструменты OCR, которые помогают пользователям обучать лучшие модели и применять их на практике
<div align="center">
<img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800">
</div>
<div align="center">
<img src="./doc/imgs_results/PP-OCRv3/en/en_4.png" width="800">
</div>
<div align="center">
<img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800">
</div>
## 📣 Последние обновления
- **🔥2022.8.24 Выпуск PaddleOCR [Выпуск /2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)**
- Выпускать [PP-Structurev2](./ppstructure/),с полностью обновленными функциями и производительностью, адаптированными для китайских сцен и новой поддержкой pаспознавание таблиц
[Восстановление макета](./ppstructure/recovery) и **однострочная команда для преобразования PDF в Word**;
- [Анализ макета](./ppstructure/layout) оптимизация: память модели уменьшена на 95%, а скорость увеличена в 11 раз, а среднее время процессорного времени составляет всего 41 мс;
- [Распознавание таблиц](./ppstructure/table) оптимизация: разработано 3 стратегии оптимизации, а точность модели улучшена на 6% при сопоставимых затратах времени;
- [Извлечение ключевой информации](./ppstructure/kie) оптимизация: разработана визуально независимая структура модели, точность распознавания семантической сущности увеличена на 2,8%, а точность извлечения отношения увеличена на 9,1%.
- **🔥2022.7 Выпуск [Коллекция приложений сцены OCR](./applications/README_en.md)**
- Выпуск **9 вертикальных моделей**, таких как цифровая трубка, ЖК-экран, номерной знак, модель распознавания рукописного ввода, высокоточная модель SVTR и т. д., охватывающих основные вертикальные приложения OCR в целом, производственной, финансовой и транспортной отраслях.
- **🔥2022.5.9 Выпуск PaddleOCR [Выпуск /2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)**
- Выпускать [PP-OCRv3](./doc/doc_en/ppocr_introduction_en.md#pp-ocrv3): При сопоставимой скорости эффект китайской сцены улучшен на 5% по сравнению с ПП-OCRRv2, эффект английской сцены улучшен на 11%, а средняя точность распознавания 80 языковых многоязычных моделей улучшена более чем на 5%.
- Выпускать [PPOCRLabelv2](./PPOCRLabel): Добавьте функцию аннотации для задачи распознавания таблиц, задачи извлечения ключевой информации и изображения неправильного текста.
- Выпустить интерактивную электронную книгу [*"Погружение в OCR"*](./doc/doc_en/ocr_book_en.md), охватывает передовую теорию и практику кодирования технологии полного стека OCR.
- [подробнее](./doc/doc_en/update_en.md)
## 🌟 Функции
PaddleOCR поддерживает множество передовых алгоритмов, связанных с распознаванием текста, и разработала промышленные модели/решения. [PP-OCR](./doc/doc_en/ppocr_introduction_en.md) и [PP-Structure](./ppstructure/README.md) на этой основе и пройти весь процесс производства данных, обучения модели, сжатия, логического вывода и развертывания.
<div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186171245-40abc4d7-904f-4949-ade1-250f86ed3a90.png">
</div>
## ⚡ Быстрый опыт
```bash
pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
```
> Если у вас нет среды Python, выполните [Подготовка среды](./doc/doc_en/environment_en.md). Мы рекомендуем вам начать с [Учебники](#Tutorials).
<a name="книга"></a>
## 📚 Электронная книга: *Погружение в OCR*
- [Погружение в распознавание символов](./doc/doc_en/ocr_book_en.md)
<a name="Сообщество"></a>
## 👫 Сообщество
Что касается международных разработчиков, мы рассматриваем [Обсуждения PaddleOCR](https://github.com/PaddlePaddle/PaddleOCR/discussions) как нашу платформу для международного сообщества. Все идеи и вOCRосы можно обсудить здесь на английском языке.
<a name="Список-поддерживаемых-китайских-моделей"></a>
## 🛠️ Список моделей серии ПП -OCR
| Введение модели | Название модели | Рекомендуемая сцена | Модель обнаружения | Классификатор направлений | Модель распознавания |
| ------------------------------------------------------------ | ---------------------------- | ----------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
| Ру́сский язы́к:Ру́сский язы́к Сверхлегкая модель ПП-OCRv3 (13.4M) | модель И18н | Мобильный и сервер | | | |
| Английский сверхлегкая модель ПП-OCRv3 (13,4 Мб) | en\_ПП-OCRv3_xx |Мобильный и сервер | [модель вывода](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_distill_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar) |
| Сверхлегкая китайская и английская модель ПП-OCRv3 (16,2M) | ch\_ПП-OCRv3_xx | Мобильный и сервер | [вывод модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [вывод модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [обученный модель](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) |
- Для получения дополнительных загрузок моделей (включая несколько языков) см. [Загрузки моделей серии ПП-OCR](./doc/doc_en/models_list_en.md).
- Для запроса нового языка см[Руководство для новых языковых_запросов] (#language_requests).
- Модели структурного анализа документов см[PP-Structure модельs](./ppstructure/docs/модельs_list_en.md).
<a name=" Учебники "></a>
## 📖 Учебники
- [Подготовка окружающей среды](./doc/doc_en/environment_en.md)
- [PP-OCR 🔥](./doc/doc_en/ppocr_introduction_en.md)
- [Быстрый старт](doc/doc_en/quickstart_en.md)
- [Модель Zoo](./doc/doc_en/модельs_en.md)
- [Модель тренировки](./doc/doc_en/training_en.md)
- [Обнаружение текста](./doc/doc_en/detection_en.md)
- [Распознавание текста](./doc/doc_en/recognition_en.md)
- [Классификация направления текста](./doc/doc_en/angle_class_en.md)
- Модель Сжатие
- [Модель квантования](./deploy/slim/quantization/README_en.md)
- [Модель Обрезка](./deploy/slim/prune/README_en.md)
- [Дистилляция знаний](./doc/doc_en/knowledge_distillation_en.md)
- [Вывод и развертывание](./deploy/README.md)
- [Python Вывод](./doc/doc_en/ inference _ppocr_en.md)
- [Вывод C++](./deploy/cpp_infer/readme.md)
-[Подача](./deploy/pdserving/README.md)
- [Мобильный](./deploy/lite/readme.md)
- [Paddle2ONNX](./deploy/paddle2onnx/readme.md)
-[ВеслоОблако](./deploy/paddlecloud/README.md)
- [Benchmark](./doc/doc_en/benchmark_en.md)
- [PP-Structure 🔥](./ppstructure/README.md)
- [Быстрый старт](./ppstructure/docs/quickstart_en.md)
- [Модель Zoo](./ppstructure/docs/модельs_list_en.md)
- [Модель тренировки](./doc/doc_en/training_en.md)
- [Анализ макета](./ppstructure/layout/README.md)
- [Распознавание таблиц](./ppstructure/table/README.md)
- [Извлечение ключевой информации](./ppstructure/kie/README.md)
- [Вывод и развертывание](./deploy/README.md)
- [Вывод Python](./ppstructure/docs/inference_en.md)
- [Вывод С++](./deploy/cpp_infer/readme.md)
- [Обслуживание](./deploy/hubserving/readme_en.md)
- [Академические алгоритмы](./doc/doc_en/algorithm_overview_en.md)
- [Обнаружение текста](./doc/doc_en/algorithm_overview_en.md)
- [Распознавание текста](./doc/doc_en/algorithm_overview_en.md)
- [Непрерывной цепью OCR](./doc/doc_en/algorithm_overview_en.md)
- [Распознавание таблиц](./doc/doc_en/algorithm_overview_en.md)
- [Извлечение ключевой информации](./doc/doc_en/algorithm_overview_en.md)
- [Добавьте новые алгоритмы в PaddleOCR](./doc/doc_en/add_new_algorithm_en.md)
- Аннотации и синтез данных
- [Полуавтоматический инструмент аннотации данных: метка ППOCRR](./PPOCRLabel/README.md)
- [Инструмент синтеза данных: Стиль-текст](./StyleText/README.md)
- [Другие инструменты аннотирования данных](./doc/doc_en/data_annotation_en.md)
- [Другие инструменты синтеза данных](./doc/doc_en/data_synthesis_en.md)
- Наборы данных
- [Общие наборы данных OCR (китайский/английский)](doc/doc_en/dataset/datasets_en.md)
- [Наборы данных Рукописный/_OCR_ наборы данных (китайский)](doc/doc_en/dataset/handwritten_datasets_en.md)
- [Различные наборы данных OCR (многоязычные)](doc/doc_en/dataset/vertical_and_multilingual_datasets_en.md)
- [Анализ макета](doc/doc_en/dataset/layout_datasets_en.md)
- [Распознавание таблиц](doc/doc_en/dataset/table_datasets_en.md)
- [Извлечение ключевой информации](doc/doc_en/dataset/kie_datasets_en.md)
- [Структура кода](./doc/doc_en/tree_en.md)
- [Визуализация](#Visualization)
- [Сообщество](#Community)
- [Новые языковые запросы](#language_requests)
- [ЧАСТО ЗАДАВАЕМЫЕ ВOCRОСЫ](./doc/doc_en/FAQ_en.md)
- [Использованная литература](./doc/doc_en/reference_en.md)
- [ЛИЦЕНЗИЯ](#LICENSE)
<a name="language_requests"></a>
## 🇺🇳 Руководство по запросам на новый язык
Если вы хотите **запросить новую языковую модель**, проголосуйте в [Голосуйте за обновление многоязычной модели](https://github.com/PaddlePaddle/PaddleOCR/discussions/7253). Мы будем регулярно обновлять модель по результату. **Пригласите друзей проголосовать вместе!**
Если вам нужно **обучить новую языковую модель** на основе вашего сценария, учебное пособие в [Проекте обучения многоязычной модели](https://github.com/PaddlePaddle/PaddleOCR/discussions/7252) поможет вам подготовить набор данных и показать вам весь процесс шаг за шагом.
Оригинальный [Многоязычный план разработки OCR](https://github.com/PaddlePaddle/PaddleOCR/issues/1048) по-прежнему показывает вам много полезных корпусов и словарей.
<a name=" Визуализация "></a>
## 👀 Визуализация [больше](./doc/doc_en/visualization_en.md)
<details open>
<summary>PP-OCRv3 Многоязычная модель </summary>
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800">
</div>
</details>
<details open>
<summary>PP-OCRv3 Aнглийская модель </summary>
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/en/en_1.png" width="800">
<img src="doc/imgs_results/PP-OCRv3/en/en_2.png" width="800">
</div>
</details>
<details open>
<summary>PP-OCRv3 Kитайская модель </summary>
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800">
</div>
</details>
<details open>
<summary>PP-Structurev2</summary>
1. анализ макета + распознавание таблиц
<div align="center">
<img src="./ppstructure/docs/table/ppstructure.GIF" width="800">
</div>
2. SER (Семантическое распознавание объектов)
<div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186094456-01a1dd11-1433-4437-9ab2-6480ac94ec0a.png" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185310636-6ce02f7c-790d-479f-b163-ea97a5a04808.jpg" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185539517-ccf2372a-f026-4a7c-ad28-c741c770f60a.png" width="600">
</div>
3. RE (Извлечение отношений)
<div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186094813-3a8e16cc-42e5-4982-b9f4-0134dfb5688d.png" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185393805-c67ff571-cf7e-4217-a4b0-8b396c4f22bb.jpg" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185540080-0431e006-9235-4b6d-b63d-0b3c6e1de48f.jpg" width="600">
</div>
</details>
<a name="ЛИЦЕНЗИЯ"></a>
## 📄 Лицензия
Этот проект выпущен под <a href="https://github.com/PaddlePaddle/PaddleOCR/blob/master/LICENSE">Apache 2.0 license</a>
此差异已折叠。
English | [简体中文](README_ch.md)
<p align="center">
<img src="./doc/PaddleOCR_log.png" align="middle" width = "600"/>
<p align="center">
<p align="left">
<a href="./LICENSE"><img src="https://img.shields.io/badge/license-Apache%202-dfd.svg"></a>
<a href="https://github.com/PaddlePaddle/PaddleOCR/releases"><img src="https://img.shields.io/github/v/release/PaddlePaddle/PaddleOCR?color=ffa"></a>
<a href=""><img src="https://img.shields.io/badge/python-3.7+-aff.svg"></a>
<a href=""><img src="https://img.shields.io/badge/os-linux%2C%20win%2C%20mac-pink.svg"></a>
<a href=""><img src="https://img.shields.io/pypi/format/PaddleOCR?color=c77"></a>
<a href="https://pypi.org/project/PaddleOCR/"><img src="https://img.shields.io/pypi/dm/PaddleOCR?color=9cf"></a>
<a href="https://github.com/PaddlePaddle/PaddleOCR/stargazers"><img src="https://img.shields.io/github/stars/PaddlePaddle/PaddleOCR?color=ccf"></a>
</p>
## 紹介
PaddleOCR は、さまざまな言語で、優れた最先端かつ実用的な OCR ツールを作成することを目的とし、ユーザーがより優れたモデルをトレーニングし、実践的に対応できるようになるために役立つAIOCRです。
<div align="center">
<img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800">
</div>
<div align="center">
<img src="./doc/imgs_results/PP-OCRv3/en/en_4.png" width="800">
</div>
<div align="center">
<img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800">
</div>
## 📣 最新アップデート
- **🔥2022.8.24 リリース PaddleOCR [release/2.6 ](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)**
- [PP-Structurev2](./ppstructure/)がリリース。機能と使いやすさがアップグレード、中国語のさまざまな文字に適応、 [レイアウトの復旧](./ppstructure/recovery) さらに**1 行のコマンドをPDFへ転換、そして Word**に変換可能。
- [レイアウト分析](./ppstructure/layout) の最適化:モデルのストレージが 95% 削減、速度が 11 倍向上、平均 CPU 時間コストはわずか 41 ミリ秒です。
- [表認識](./ppstructure/table) 最適化:3つの最適化戦略設計、モデルの精度が従来より同時間比が 6% 向上。
- [キー情報抽出](./ppstructure/kie) 最適化:視覚に依存しないモデル構造設計、語彙の実態識別精度が 2.8% 向上、関係抽出の精度が 9.1% 向上。
- **🔥2022.7 リリース [OCR scene application collection](./applications/README_en.md)**
- デジタルチューブ、液晶画面、ナンバー プレート、手書き認識モデル、高精度 SVTR モデルなど、**9つの垂直モデル**をリリース、一般、製造、金融、運輸業界の主要な OCR 垂直アプリケーションをカバー。
- **🔥2022.5.9 リリース PaddleOCR [release/2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)**
- [PP-OCRv3](./doc/doc_en/ppocr_introduction_en.md#pp-ocrv3)リリース: 同等の速度で、中国語の識別効果は PP-OCRv2 より 5% 向上、英語の識別効果は 11% 向上し、80 言語の多言語モデルの平均認識精度は 5% 以上向上。
- [PPOCRLabelv2](./PPOCRLabel)リリース: 表認識タスク、キー情報抽出タスク、イレギュラーテキスト画像のアノテーション機能を追加。
- インタラクティブな電子書籍 [*"OCR に没入"*](./doc/doc_en/ocr_book_en.md)、 をリリース。 OCRフルスタック技術の最先端の理論とコードの実践をカバー。
- [もっと](./doc/doc_en/update_en.md)
## 🌟 PaddleOCRとは?
PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムに対応する、産業用の機能モデル/ソリューション [PP-OCR](./doc/doc_en/ppocr_introduction_en.md)[PP-Structure](./ppstructure/README.md) を開発。これに基づき、データの生成、モデルのトレーニング、圧縮、推論、展開の全プロセスを実行可能。
<div align="center">
<img src="https://user-images.githubusercontent.com/50011306/195771471-fad5eb1d-190d-4a7b-8b0c-0433fb32445f.png">
</div>
## ⚡ 今すぐトライアル
```bash
pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
```
>Python環境がない場合は [環境の準備](./doc/doc_en/environment_en.md)に従ってください。[チュートリアル](#Tutorials) から始めることをお勧めします。
<a name="本"></a>
## 📚 電子書籍:*OCRに入る*
- [OCRに没入](./doc/doc_en/ocr_book_en.md)
<a name="コミュニティ"></a>
## 👫コミュニティー
他国の開発者の方は [PaddleOCR Discussions](https://github.com/PaddlePaddle/PaddleOCR/discussions) を国際的なコミュニティ プラットフォームとして使用します。みなさんのアイデアや質問がある場合、ここで英語で話し合うことができます。
<a name="対応中国機種一覧"></a>
## 🛠️ シリーズ モデル式一覧
| モデル紹介 | モデル名 | 推奨のシーン | 検出モデル | 方向分類器 | 認識モデル |
| ------------------------------------------------------------ | ---------------------------- | ----------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
| 日本語超軽量 PP-OCRv3 モデル(13.4M) | I18n モデル | モバイル & サーバー | | | |
| 英語超軽量PP-OCRv3モデル(13.4M) | en_PP-OCRv3_xx | モバイル & サーバー | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_distill_train.tar) | [推論モデル](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar) |
| 中国語と英語の超軽量 PP-OCRv3 モデル(16.2M) | ch_PP-OCRv3_xx | モバイル & サーバー | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [推論モデル](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [推論モデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [トレーニングモデル](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) |
- その他のモデルのダウンロード (多言語を含む) については、[PP-OCR シリーズ モデルのダウンロード] (./doc/doc_en/models_list_en.md)をご参照ください。
- 新しい言語のリクエストについては、 [新しい言語_リクエストのガイドライン](#language_requests)を参照してください。
- 構造文書分析モデルについては、[PP-Structure models](./ppstructure/docs/models_list_en.md)をご参照ください。
<a name="チュートリアル"></a>
## 📖 チュートリアル
- [環境の準備](./doc/doc_en/environment_en.md)
- [PP-OCR 🔥](./doc/doc_en/ppocr_introduction_en.md)
- [クイックスタート](./doc/doc_en/quickstart_en.md)
- [Model Zoo](./doc/doc_en/models_en.md)
- [トレーニング モデル](./doc/doc_en/training_en.md)
- [テキスト検出](./doc/doc_en/detection_en.md)
- [テキスト認識](./doc/doc_en/recognition_en.md)
- [テキスト方向の分類](./doc/doc_en/angle_class_en.md)
- モデル圧縮
- [モデルの量子化](./deploy/slim/quantization/README_en.md)
- [モデルの剪裁](./deploy/slim/prune/README_en.md)
- [知識の蒸留](./doc/doc_en/knowledge_distillation_en.md)
- [推論と展開](./deploy/README.md)
- [Python 推論](./doc/doc_en/inference_ppocr_en.md)
- [C++ 推論](./deploy/cpp_infer/readme.md)
- [サービング](./deploy/pdserving/README.md)
- [モバイル](./deploy/lite/readme.md)
- [Paddle2ONNX](./deploy/paddle2onnx/readme.md)
- [PaddleCloud](./deploy/paddlecloud/README.md)
- [Benchmark](./doc/doc_en/benchmark_en.md)
- [PP-Structure 🔥](./ppstructure/README.md)
- [クイックスタート](./ppstructure/docs/quickstart_en.md)
- [Model Zoo](./ppstructure/docs/models_list_en.md)
- [トレーニング モデル](./doc/doc_en/training_en.md)
- [レイアウト分析](./ppstructure/layout/README.md)
- [表認識](./ppstructure/table/README.md)
- [キー情報抽出](./ppstructure/kie/README.md)
- [推論と展開](./deploy/README.md)
- [Python 推論](./ppstructure/docs/inference_en.md)
- [C++ 推論](./deploy/cpp_infer/readme.md)
- [サービング](./deploy/hubserving/readme_en.md)
- [アカデミックアリゴリズム](./doc/doc_en/algorithm_overview_en.md)
- [テキスト検出](./doc/doc_en/algorithm_overview_en.md)
- [テキスト認識](./doc/doc_en/algorithm_overview_en.md)
- [エンド・ツー・エンド OCR](./doc/doc_en/algorithm_overview_en.md)
- [表認識](./doc/doc_en/algorithm_overview_en.md)
- [キー情報抽出](./doc/doc_en/algorithm_overview_en.md)
- [PaddleOCR に新しいアルゴリズムを追加する](./doc/doc_en/add_new_algorithm_en.md)
- データの注釈と合成
- [半自動注釈ツール: PPOCRLabel](./PPOCRLabel/README.md)
- [データ合成ツール: Style-Text](./StyleText/README.md)
- [その他のデータ注釈ツール](./doc/doc_en/data_annotation_en.md)
- [その他のデータ合成ツール](./doc/doc_en/data_synthesis_en.md)
- データセット
- [一般OCRデータセット(中国語/英語)](doc/doc_en/dataset/datasets_en.md)
- [HandWritten_OCR_Datasets(中国語)](doc/doc_en/dataset/handwritten_datasets_en.md)
- [各種OCRデータセット(多言語対応)](doc/doc_en/dataset/vertical_and_multilingual_datasets_en.md)
- [レイアウト分析](doc/doc_en/dataset/layout_datasets_en.md)
- [表認識](doc/doc_en/dataset/table_datasets_en.md)
- [キー情報抽出](doc/doc_en/dataset/kie_datasets_en.md)
- [コード構造](./doc/doc_en/tree_en.md)
- [視覚化](#Visualization)
- [コミュニティ](#Community)
- [新言語のリクエスト](#language_requests)
- [よくある質問](./doc/doc_en/FAQ_en.md)
- [参考文献](./doc/doc_en/reference_en.md)
- [ライセンス](#LICENSE)
<a name="language_requests"></a>
## 🇺🇳 新しい言語リクエストのガイドライン
**新言語モデルをリクエスト**したい場合、[多言語モデルのアップグレードへの投票](https://github.com/PaddlePaddle/PaddleOCR/discussions/7253)で投票してください。投票結果に応じて定期的にモデルがアップグレードされます。**友達を招待して一緒に投票しましょう!**
シナリオに基づいて**新しい言語モデルをトレーニング** する必要がある場合は、[多言語モデル トレーニング プロジェクト](https://github.com/PaddlePaddle/PaddleOCR/discussions/7252) のチュートリアルがデータセットの準備にご利用でき、 プロセス全体を段階的に表示することができます。
元の[多言語 OCR 開発計画](https://github.com/PaddlePaddle/PaddleOCR/issues/1048) には、まだ多くの有用なコーパスと辞書が表示されています
<a name="ビジュアリゼーション"></a>
## 👀 ビジュアリゼーション [more](./doc/doc_en/visualization_en.md)
<details open>
<summary>PP-OCRv3 多言語モデル</summary>
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800">
</div>
</details>
<details open>
<summary>PP-OCRv3 英語 モデル</summary>
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/en/en_1.png" width="800">
<img src="doc/imgs_results/PP-OCRv3/en/en_2.png" width="800">
</div>
</details>
<details open>
<summary>PP-OCRv3 中国語 モデル</summary>
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800">
</div>
</details>
<details open>
<summary>PP-Structurev2</summary>
1. レイアウト分析+テーブル認識
<div align="center">
<img src="./ppstructure/docs/table/ppstructure.GIF" width="800">
</div>
2. SER (セマンティックエンティティ認識)
<div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186094456-01a1dd11-1433-4437-9ab2-6480ac94ec0a.png" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185310636-6ce02f7c-790d-479f-b163-ea97a5a04808.jpg" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185539517-ccf2372a-f026-4a7c-ad28-c741c770f60a.png" width="600">
</div>
3. RE (関係抽出)
<div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186094813-3a8e16cc-42e5-4982-b9f4-0134dfb5688d.png" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185393805-c67ff571-cf7e-4217-a4b0-8b396c4f22bb.jpg" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185540080-0431e006-9235-4b6d-b63d-0b3c6e1de48f.jpg" width="600">
</div>
</details>
<a name="ライセンス"></a>
## 📄 ライセンス
このプロジェクトは以下の場所でリリースされています <a href="https://github.com/PaddlePaddle/PaddleOCR/blob/master/LICENSE">Apache 2.0 license</a>
English | [简体中文](README_ch.md)
<p align="center">
<img src="./doc/PaddleOCR_log.png" align="middle" width = "600"/>
<p align="center">
<p align="left">
<a href="./LICENSE"><img src="https://img.shields.io/badge/license-Apache%202-dfd.svg"></a>
<a href="https://github.com/PaddlePaddle/PaddleOCR/releases"><img src="https://img.shields.io/github/v/release/PaddlePaddle/PaddleOCR?color=ffa"></a>
<a href=""><img src="https://img.shields.io/badge/python-3.7+-aff.svg"></a>
<a href=""><img src="https://img.shields.io/badge/os-linux%2C%20win%2C%20mac-pink.svg"></a>
<a href=""><img src="https://img.shields.io/pypi/format/PaddleOCR?color=c77"></a>
<a href="https://pypi.org/project/PaddleOCR/"><img src="https://img.shields.io/pypi/dm/PaddleOCR?color=9cf"></a>
<a href="https://github.com/PaddlePaddle/PaddleOCR/stargazers"><img src="https://img.shields.io/github/stars/PaddlePaddle/PaddleOCR?color=ccf"></a>
</p>
## 소개
PaddleOCR은 사용자들이 보다 나은 모델을 훈련하여 실전에 투입하는데 도움을 주는 다중 언어로 된 엄청나게 멋지고 주도적이며 실용적인 OCR 툴을 만드는데 목표를 두고 있습니다.
<div align="center">
<img src="https://user-images.githubusercontent.com/50011306/187821591-6cb09459-fdbf-4ad3-8c5a-26af611c211d.png" width="800">
</div>
<div align="center">
<img src="./doc/imgs_results/PP-OCRv3/en/en_4.png" width="800">
</div>
<div align="center">
<img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800">
</div>
## 📣최근 업데이트
- **🔥2022년 8월 24일에 패들 OCR 출시 [출시/2.6](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6)**
차이니즈 씬에 맞춘 완전 업그레이드 된 기능과 성능을 갖춘 ; [PP-Structurev2](./ppstructure/) 출시, 그리고 레이아웃 리커버리 ](./ppstructure/recovery) 신규 지원 및 PDF 를 워드로 전환하는 원 라인 명령
- [레이아웃 분석](./ppstructure/layout) 최적화: 95% 감소된 모델 저장, while 반면 속도는 11배 증가하고, 평균 CPU 시간 비용은 41ms에 불과함;
- [표 인식](./ppstructure/table) 최적화: 3 최적화 전략이 디자인되고 모델 정확도는 비교 가능한 시간 소비 하에 6% 개선됨;
- [핵심 정보 추출](./ppstructure/kie) 최적화: 시각에 의존하지 않는 모델 구조가 디자인되고, 의미체 인식 정확도가 2.8% 증가되며 관계 추출 정확도는 9.1% 증가됨.
- **🔥2022년 7월 출시[OCR 씬 애플리케이션 컬렉션](./applications/README_en.md)**
디지털 튜브, LCD 스크린, 라이선스 플레이트, 수기 인식 모델, 고정밀 SVTR 모델 등등과 같은 “9수직 모델” 출시로, 일반적으로 주된 OCR 수직 애플리케이션, 제조, 금융 및 수송 산업 커버
- **🔥2022년 5월 9일에 패들 OCR 출시 [출시/2.5](https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.5)**
- [PP-OCRv3](./doc/doc_en/ppocr_introduction_en.md#pp-ocrv3)출시: 5%.비교 가능한 속도로, 차이니즈 씬의 효과는 PP-OCRv2와 비교해 볼 때 추가로 5% 정도 더 개선되고, 잉글리쉬 씬 효과는 11% 개선되었으며, 80개 언어 다중 언어 모델 평균 인식 정확도는 5% 이상 개선됨.
- [PPOCRLabelv2](./PPOCRLabel)출시: 표 인식 업무, 핵심 정보 추출 업무 및 불규칙한 텍스트 이미지주석 기능 추가.
- 쌍방향e-북 출시 [*"OCR 뛰어들기"*](./doc/doc_en/ocr_book_en.md), 첨단 이론 및 OCR 정식 스택 기술 코드 연습 포함.
- [추가](./doc/doc_en/update_en.md)
## 🌟특징
패들OCR은 OCR 관련 다양한 첨단 알고리즘 지원 [PP-OCR](./doc/doc_en/ppocr_introduction_en.md)[PP-Structure](./ppstructure/README.md) 이를 기반으로, 그리고 전체 데이터 생산 처리, 모델 훈련, 압축, 추론 및 배치를 통해 획득.
<div align="center">
<img src="https://user-images.githubusercontent.com/50011306/195770559-1f107881-d821-4426-90cd-fe81b9ae78e7.png">
</div>
## ⚡ 신속한 경험
```bash
pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir ./doc/imgs_en/254.jpg --lang=en # change for i18n abbr
```
>만일 당신이 파이톤 환경이 없다면 [환경 준비]를 따르기 바람(./doc/doc_en/environment_en.md). 우리는 당신이[사용지침 프로그램]으로 시작할 것을 권장합니다.(#Tutorials).
<a name="북"></a>
## 📚 E-북: *OCR로 뛰어들기*
- [OCR로 뛰어들기](./doc/doc_en/ocr_book_en.md)
<a name="커뮤니티"></a>
## 👫 커뮤니티로
국제 개발자들을 위해 우리는 [PaddleOCR 논의하기](https://github.com/PaddlePaddle/PaddleOCR/discussions) 를 우리의 국제 커뮤니티로 간주. 모든 아이디어와 질문은 여기서 영어로 논의 가능.
<a name="지원됨 – 차이니즈-모델-목록- "></a>
## PP-OCR 시리즈 모델 목록
| 모델 소개 |모델 명 | 권장 씬| 감지 모델 | 지시 분류사 |인식 모델 |
| ------------------------------------------------------------ | ---------------------------- | ----------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
| 한국어 초경량 PP-OCRv3 모델(13.4M) | I18n 모델 | 모바일 & 서버 | | | |
| 영어 초경량 PP-OCRv3 모델(13.4M) | en_PP-OCRv3_xx | 모바일 & 서버 | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_distill_train.tar) | [추론 모델](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar) |
| 중국어 및 영어 초경량 PP-OCRv3 model(16.2M) | ch_PP-OCRv3_xx | 모바일 & 서버 | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar) | [추론 모델](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar) | [추론 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar) / [훈련 모델](https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar) |
- (다중 언어를 포함하여)더 많은 모델을 다운로드 하려면, [PP-OCR 시리즈 모델 다운로드](doc/doc_en/models_list_en.md)를 참조할 것.
- 신규 언어 요청에 대해서는, [신규 언어 요청 지침](#language_requests)을 참조할 것.
- 구조적 문서 분석 모델에 대해서는, [PP-Structure models](./ppstructure/docs/models_list_en.md).을 참조할 것.
<a name="사용 지침 프로그램"></a>
## 📖 사용 지침 프로그램
- [환경 준비](./doc/doc_en/environment_en.md)
- [PP-OCR 🔥](./doc/doc_en/ppocr_introduction_en.md)
- [신속한 시작](./doc/doc_en/quickstart_en.md)
- [동물원 모델](./doc/doc_en/models_en.md)
- [모델 훈련](./doc/doc_en/training_en.md)
- [텍스트 감지](./doc/doc_en/detection_en.md)
- [텍스트 인식](./doc/doc_en/recognition_en.md)
- [텍스트 방향 분류](./doc/doc_en/angle_class_en.md)
- 모델 압축
- [모델 계량화](./deploy/slim/quantization/README_en.md)
- [모델 전지작업](./deploy/slim/prune/README_en.md)
- [지식 정제](./doc/doc_en/knowledge_distillation_en.md)
- [추론 및 배치](./deploy/README.md)
- [파이톤 추론](./doc/doc_en/inference_ppocr_en.md)
- [C++ 추론](./deploy/cpp_infer/readme.md)
- [서빙](./deploy/pdserving/README.md)
- [모바일](./deploy/lite/readme.md)
- [Paddle2ONNX](./deploy/paddle2onnx/readme.md)
- [패들 클라우드](./deploy/paddlecloud/README.md)
- [Benchmark](./doc/doc_en/benchmark_en.md)
- [PP-Structure 🔥](./ppstructure/README.md)
- [신속한 시작](./ppstructure/docs/quickstart_en.md)
- [동물원 모델](./ppstructure/docs/models_list_en.md)
- [모델 훈련](./doc/doc_en/training_en.md)
- [레이아웃 분석](./ppstructure/layout/README.md)
- [표 인식](./ppstructure/table/README.md)
- [핵심 정보 추출](./ppstructure/kie/README.md)
- [추론 및 배치](./deploy/README.md)
- [파이톤 추론](./ppstructure/docs/inference_en.md)
- [C++ 추론](./deploy/cpp_infer/readme.md)
- [서빙](./deploy/hubserving/readme_en.md)
- [학문적 알고리즘](./doc/doc_en/algorithm_overview_en.md)
- [텍스트 감지](./doc/doc_en/algorithm_overview_en.md)
- [텍스트 인식](./doc/doc_en/algorithm_overview_en.md)
- [종단종OCR](./doc/doc_en/algorithm_overview_en.md)
- [표 인식](./doc/doc_en/algorithm_overview_en.md)
- [핵심 정보 추출](./doc/doc_en/algorithm_overview_en.md)
- [PaddleOCR에 신규 알고리즘 추가](./doc/doc_en/add_new_algorithm_en.md)
- 데이터 주석 및 합성
- [반-자동 주석 툴: PPOCRLabel](./PPOCRLabel/README.md)
- [데이터 합성 툴: 스타일-텍스트](./StyleText/README.md)
- [기타 데이터 주석 툴](./doc/doc_en/data_annotation_en.md)
- [기타 데이터 합성 툴](./doc/doc_en/data_synthesis_en.md)
- 데이터세트
- [일반 OCR 데이터세트(중국어/영어)](doc/doc_en/dataset/datasets_en.md)
- [수기_OCR_데이터세트(중국어)](doc/doc_en/dataset/handwritten_datasets_en.md)
- [다양한 OCR 데이터세트(다중언어)](doc/doc_en/dataset/vertical_and_multilingual_datasets_en.md)
- [레이아웃 분석](doc/doc_en/dataset/layout_datasets_en.md)
- [표 인식](doc/doc_en/dataset/table_datasets_en.md)
- [핵심 정보 추출](doc/doc_en/dataset/kie_datasets_en.md)
- [코드 구조](./doc/doc_en/tree_en.md)
- [시각화](#Visualization)
- [커뮤니티](#Community)
- [신규 언어 요청](#language_requests)
- [자주 묻는 질문](./doc/doc_en/FAQ_en.md)
- [추론](./doc/doc_en/reference_en.md)
- [라이선스](#LICENSE)
<a name="language_requests"></a>
## 신규 언어 요청에 대한 유엔 가이드라인
만일 신규 언어 모델을 요청하고자 한다면**, [다중 언어 모델 업그레이드 투표하기](https://github.com/PaddlePaddle/PaddleOCR/discussions/7253)에서 투표하기 바람. 우리는 결과에 따라 규칙적으로 모델을 업그레이드 시킬 것임**함께 투표하고자 당신의 친구들을 초대할 것!**
만일 당신이 시나리오 기반 “신규 언어 모델”을 훈련하고자 한다면, [다중 언어 모델 훈련 프로젝트](https://github.com/PaddlePaddle/PaddleOCR/discussions/7252) 를 통해 당신의 데이터세트를 작성하는데 도움이 되고 단계별로 전체 절차를 보여줄 것입니다.
원본[다중 언어 OCR 개발 계획](https://github.com/PaddlePaddle/PaddleOCR/issues/1048)은 여전히 수많은 유용한 말뭉치와 사전을 보여줍니다.
<a name="시각화"></a>
## 👀 시각화[추가](./doc/doc_en/visualization_en.md)
<details open>
<summary>PP-OCRv3 다중 언어 모델</summary>
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800">
</div>
</details>
<details open>
<summary>PP-OCRv3 영어 모델</summary>
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/en/en_1.png" width="800">
<img src="doc/imgs_results/PP-OCRv3/en/en_2.png" width="800">
</div>
</details>
<details open>
<summary>PP-OCRv3 중국어 모델</summary>
<div align="center">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800">
<img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800">
</div>
</details>
<details open>
<summary>PP-Structurev2</summary>
1. 레이아웃 분석 + 표 인식
<div align="center">
<img src="./ppstructure/docs/table/ppstructure.GIF" width="800">
</div>
2. SER (의미체 인식)
<div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186094456-01a1dd11-1433-4437-9ab2-6480ac94ec0a.png" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185310636-6ce02f7c-790d-479f-b163-ea97a5a04808.jpg" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185539517-ccf2372a-f026-4a7c-ad28-c741c770f60a.png" width="600">
</div>
3. RE (관계 추출)
<div align="center">
<img src="https://user-images.githubusercontent.com/25809855/186094813-3a8e16cc-42e5-4982-b9f4-0134dfb5688d.png" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185393805-c67ff571-cf7e-4217-a4b0-8b396c4f22bb.jpg" width="600">
</div>
<div align="center">
<img src="https://user-images.githubusercontent.com/14270174/185540080-0431e006-9235-4b6d-b63d-0b3c6e1de48f.jpg" width="600">
</div>
</details>
<a name="라이선스"></a>
## 📄 라이선스
본 프로젝트는 <a href="https://github.com/PaddlePaddle/PaddleOCR/blob/master/LICENSE">Apache 2.0 license</a> 하에 출시됨.
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册