fix ratio list (#5581)

edd06015 · littletomatodonkey · GitHub · e6930d9d · edd06015
隐藏空白更改
内联并排

Showing with 1 addition and 1 deletion

doc/doc_ch/FAQ.md doc/doc_ch/FAQ.md +1 -1

未找到文件。
--- a/doc/doc_ch/FAQ.md
+++ b/doc/doc_ch/FAQ.md
@@ -349,7 +349,7 @@ A：PaddleOCR已完成Windows和Mac系统适配，运行时注意两点：

 #### Q：训练文字识别模型，真实数据有30w，合成数据有500w，需要做样本均衡吗？

-A：需要，一般需要保证一个batch中真实数据样本和合成数据样本的比例是1：1~1：3左右效果比较理想。如果合成数据过大，会过拟合到合成数据，预测效果往往不佳。还有一种启发性的尝试是可以先用大量合成数据训练一个base模型，然后再用真实数据微调，在一些简单场景效果也是会有提升的。
+A：需要，一般需要保证一个batch中真实数据样本和合成数据样本的比例是5：1~10：1左右效果比较理想。如果合成数据过大，会过拟合到合成数据，预测效果往往不佳。还有一种启发性的尝试是可以先用大量合成数据训练一个base模型，然后再用真实数据微调，在一些简单场景效果也是会有提升的。

 #### Q: 当训练数据量少时，如何获取更多的数据？