RELEASE.md 4.5 KB
Newer Older
B
breezedeus 已提交
1
# Release Notes
B
breezedeus 已提交
2

B
breezedeus 已提交
3 4 5 6 7 8 9 10 11 12
### Update 2022.05.15: 发布 cnocr V2.1.1.1

主要变更:

- 增加了对 **ONNX** 模型的支持,支持 **`*-fc`** 模型,提升预测速度;
-`CnOcr` 的初始化中增加了参数 `model_backend``vocab_fp`,具体参见 [使用方法](usage.md)
- 增加了 `cnocr export-onnx` 命令,把训练好的PyTorch模型导出为ONNX模型;
- 去掉了对包 `python-Levenshtein` 的依赖。


B
breezedeus 已提交
13 14 15 16 17 18 19 20 21
### Update 2021.11.06: 发布 cnocr V2.1.0

主要变更:

* 使用了更精简的模型架构:`densenet_lite_*`
* 使用了更丰富的数据重新训练了所有模型,精度相较于之前版本更高;
* 提供了更多预训练好的模型;
* 加入了 `cnocr evaluate` 命令以评估效果。

22 23 24 25 26 27 28
### Update 2021.09.21: 发布 cnocr V2.0.1

主要变更:

* 重新训练了模型,模型识别精度略有提升;
* 函数 `CnOcr.ocr_for_single_lines(img_list, batch_size=1)` 中加入了 `batch_size` 参数。

B
breezedeus 已提交
29
### Update 2021.08.26: 发布 cnocr V2.0.0
B
breezedeus 已提交
30 31 32

主要变更:

B
breezedeus 已提交
33 34
* MXNet 越来越小众化,故从基于 MXNet 的实现转为基于 **PyTorch** 的实现;
* 重新实现了识别模型,优化了训练数据,重新训练模型;
B
breezedeus 已提交
35 36
* 优化了能识别的字符集合;
* 优化了对英文的识别效果;
B
breezedeus 已提交
37 38
* 优化了对场景文字的识别效果;
* 使用接口略有调整,请谨慎更新。
B
breezedeus 已提交
39 40 41 42 43 44 45 46

### Update 2021.08.24: 发布 cnocr V1.2.3

主要变更:

* 更改了模型的默认下载urls;
* 依赖中去掉了对numpy的约束。

B
breezedeus 已提交
47 48 49 50 51 52 53 54
### Update 2020.05.29: 发布 cnocr V1.2.2

主要变更:

* `CnOcr`加入类函数 `CnOcr.set_cand_alphabet(cand_alphabet) `。可通过此类函数设置`cand_alphabet`。这样同一个实例也可以指定不同的`cand_alphabet`进行识别。
* bugfix:
  * 修复同时初始化多个实例时会报错的问题。

B
breezedeus 已提交
55 56
### Update 2020.05.25: 发布 cnocr V1.2.1

B
breezedeus 已提交
57
主要变更:
B
breezedeus 已提交
58

B
breezedeus 已提交
59 60
* bugfix:
  * 修复了zip文件名的typo。
B
breezedeus 已提交
61

B
breezedeus 已提交
62 63 64 65 66
### Update 2020.05.25: 发布 cnocr V1.2.0

主要变更:

* 优化了对数字识别的准确度。
B
breezedeus 已提交
67 68
* 优化了模型结构,进一步降低了模型的大小,提升了预测速度;最小模型从原来的`6.8M`降为`4.7M`
* 使用了[爱因互动 Ein+](https://einplus.cn)自己的CDN存储模型文件,下载速度超快。
B
breezedeus 已提交
69 70 71 72
* 提供了预测速度更快的 `shorter (-s)`版预训练模型:`densenet-lite-s-gru``densenet-lite-s-fc`
* 默认模型由之前的`conv-lite-fc`改为`densenet-lite-fc`
* 预测支持使用GPU。
* bugfixs:
B
breezedeus 已提交
73 74 75
  * Web 调用时的内存泄露。感谢 [@myuanz](https://github.com/myuanz)
  * 输入图片宽度很小时导致异常;
  * 去掉  `f-print`
B
breezedeus 已提交
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104

### Update 2020.04.21: 发布 cnocr V1.1.0

V1.1.0对代码做了很大改动,重写了大部分训练的代码,也生成了更多更难的训练和测试数据。训练好的模型相较于之前版本的模型精度有显著提升,尤其是针对英文单词的识别。

以下列出了主要的变更:

* 更新了训练代码,使用mxnet的`recordio`首先把数据转换成二进制格式,提升后续的训练效率。训练时支持对图片做实时数据增强。也加入了更多可传入的参数。

* **允许训练集中的文字数量不同,目前是中文10个字,英文20个字母。**

* 提供了更多的模型选择,允许大家按需训练多种不同大小的识别模型。

* 内置了各种训练好的模型,最小的模型只有之前模型的`1/5`大小。所有模型都可免费使用。

* 相较于之前版本的模型,新的模型精度有显著提升,尤其是针对英文单词的识别。**新模型已经可以识别英文单词间的空格。**

* **支持文字识别只在给定字符集中进行。** 对于一些纯数字或者纯英文字母的应用场景可以带来识别率提升。

* 优化了对黑底白字多行文字图片的支持。

* mxnet依赖升级到更新的版本了。很多人反馈mxnet `1.4.1`经常找不到没法装,现在升级到`>=1.5.0,<1.7.0`

### Update 2019.07.25: 发布 cnocr V1.0.0

`cnocr`发布了预测效率更高的新版本v1.0.0。**新版本的模型跟以前版本的模型不兼容**。所以如果大家是升级的话,需要重新下载最新的模型文件。具体说明见下面(流程和原来相同)。

主要改动如下:

B
breezedeus 已提交
105 106 107 108
- **crnn模型支持可变长预测,提升预测效率**
- 支持利用特定数据对现有模型进行精调(继续训练)
- 修复bugs,如训练时`accuracy`一直为`0`
- 依赖的 `mxnet` 版本从`1.3.1`更新至 `1.4.1`