diff --git a/doc/doc_ch/FAQ.md b/doc/doc_ch/FAQ.md index 89dbf8b53ce265917c35ba9eacc8340e3be95b46..2e2942295dfd98ab11d296c7e39598aac519e766 100644 --- a/doc/doc_ch/FAQ.md +++ b/doc/doc_ch/FAQ.md @@ -39,6 +39,7 @@ PaddleOCR已完成Windows和Mac系统适配,运行时注意两点:1、在[ - 识别: 英文数据集,MJSynth和SynthText合成数据,数据量上千万。 中文数据集,LSVT街景数据集根据真值将图crop出来,并进行位置校准,总共30w张图像。此外基于LSVT的语料,合成数据500w。 + 其中,公开数据集都是开源的,用户可自行搜索下载,也可参考[中文数据集](./datasets.md),合成数据暂不开源,用户可使用开源合成工具自行合成,可参考的合成工具包括[text_renderer](https://github.com/Sanster/text_renderer)、[SynthText](https://github.com/ankush-me/SynthText)、[TextRecognitionDataGenerator](https://github.com/Belval/TextRecognitionDataGenerator)等。 10. **使用带TPS的识别模型预测报错**