Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
models
提交
1c78d279
M
models
项目概览
PaddlePaddle
/
models
大约 2 年 前同步成功
通知
232
Star
6828
Fork
2962
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
602
列表
看板
标记
里程碑
合并请求
255
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
M
models
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
602
Issue
602
列表
看板
标记
里程碑
合并请求
255
合并请求
255
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
1c78d279
编写于
4月 01, 2018
作者:
W
wanghaoshuang
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Format markdown.
上级
d38f9aa9
变更
1
显示空白变更内容
内联
并排
Showing
1 changed file
with
36 addition
and
36 deletion
+36
-36
fluid/ocr_recognition/README.md
fluid/ocr_recognition/README.md
+36
-36
未找到文件。
fluid/ocr_recognition/README.md
浏览文件 @
1c78d279
...
@@ -13,12 +13,12 @@
...
@@ -13,12 +13,12 @@
本路径下各个文件的作用如下:
本路径下各个文件的作用如下:
-
**ctc_reader.py :
**
下载、读取、处理数据。提供方法
`train()`
和
`test()`
分别产生训练集和测试集的数据迭代器。
-
**ctc_reader.py :**
下载、读取、处理数据。提供方法
`train()`
和
`test()`
分别产生训练集和测试集的数据迭代器。
-
**crnn_ctc_model.py :
**
在该脚本中定义了训练网络、预测网络和evaluate网络。
-
**crnn_ctc_model.py :**
在该脚本中定义了训练网络、预测网络和evaluate网络。
-
**ctc_train.py :
**
用于模型的训练,可通过命令
`python train.py --help`
获得使用方法。
-
**ctc_train.py :**
用于模型的训练,可通过命令
`python train.py --help`
获得使用方法。
-
**inference.py :
**
加载训练好的模型文件,对新数据进行预测。可通过命令
`python inference.py --help`
获得使用方法。
-
**inference.py :**
加载训练好的模型文件,对新数据进行预测。可通过命令
`python inference.py --help`
获得使用方法。
-
**eval.py :
**
评估模型在指定数据集上的效果。可通过命令
`python inference.py --help`
获得使用方法。
-
**eval.py :**
评估模型在指定数据集上的效果。可通过命令
`python inference.py --help`
获得使用方法。
-
**utility.py :
**
实现的一些通用方法,包括参数配置、tensor的构造等。
-
**utility.py :**
实现的一些通用方法,包括参数配置、tensor的构造等。
### 1.1 数据
### 1.1 数据
...
@@ -107,50 +107,50 @@ python ctc_train.py [options]
...
@@ -107,50 +107,50 @@ python ctc_train.py [options]
其中,options支持配置以下训练相关的参数:
其中,options支持配置以下训练相关的参数:
**- -batch_size :
**
Minibatch 大小,默认为32.
**- -batch_size :**
Minibatch 大小,默认为32.
**- -pass_num :
**
训练多少个pass。默认为100。
**- -pass_num :**
训练多少个pass。默认为100。
**- -log_period :
**
每隔多少个minibatch打印一次训练日志, 默认为1000.
**- -log_period :**
每隔多少个minibatch打印一次训练日志, 默认为1000.
**- -save_model_period :
**
每隔多少个minibatch保存一次模型。默认为15000。
**- -save_model_period :**
每隔多少个minibatch保存一次模型。默认为15000。
如果设置为-1,则永不保存模型。
如果设置为-1,则永不保存模型。
**- -eval_period :
**
每隔多少个minibatch用测试集测试一次模型。默认为15000。如果设置为-1,则永不进行测试。
**- -eval_period :**
每隔多少个minibatch用测试集测试一次模型。默认为15000。如果设置为-1,则永不进行测试。
**- -save_model_dir :
**
保存模型文件的路径,默认为“./models”,如果指定路径不存在,则会自动创建路径。
**- -save_model_dir :**
保存模型文件的路径,默认为“./models”,如果指定路径不存在,则会自动创建路径。
**- -init_model :
**
初始化模型的路径。如果模型是以单个文件存储的,这里需要指定具体文件的路径;如果模型是以多个文件存储的,这里只需指定多个文件所在文件夹的路径。该选项默认为 None,意思是不用预训练模型做初始化。
**- -init_model :**
初始化模型的路径。如果模型是以单个文件存储的,这里需要指定具体文件的路径;如果模型是以多个文件存储的,这里只需指定多个文件所在文件夹的路径。该选项默认为 None,意思是不用预训练模型做初始化。
**- -learning_rate :
**
全局learning rate. 默认为 0.001.
**- -learning_rate :**
全局learning rate. 默认为 0.001.
**- -l2 :
**
L2 regularizer. 默认为0.0004.
**- -l2 :**
L2 regularizer. 默认为0.0004.
**- -max_clip
:
**
Max gradient clipping threshold. 默认为10.0.
**- -max_clip
:
**
Max gradient clipping threshold. 默认为10.0.
**- -momentum :
**
Momentum. 默认为0.9.
**- -momentum :**
Momentum. 默认为0.9.
**- -rnn_hidden_size
:
**
RNN 隐藏层大小。 默认为200。
**- -rnn_hidden_size
:
**
RNN 隐藏层大小。 默认为200。
**- -device DEVICE :
**
设备ID。设置为-1,训练在CPU执行;设置为0,训练在GPU上执行。默认为0。
**- -device DEVICE :**
设备ID。设置为-1,训练在CPU执行;设置为0,训练在GPU上执行。默认为0。
**- -min_average_window :
**
Min average window. 默认为10000.
**- -min_average_window :**
Min average window. 默认为10000.
**- -max_average_window :
**
Max average window. 建议大小设置为一个pass内minibatch的数量。默认为15625.
**- -max_average_window :**
Max average window. 建议大小设置为一个pass内minibatch的数量。默认为15625.
**- -average_window :
**
Average window. 默认为0.15.
**- -average_window :**
Average window. 默认为0.15.
**- -parallel :
**
是否使用多卡进行训练。默认为True.
**- -parallel :**
是否使用多卡进行训练。默认为True.
**- -train_images :
**
存放训练集图片的路径,如果设置为None,ctc_reader会自动下载使用默认数据集。如果使用自己的数据进行训练,需要修改该选项。默认为None。
**- -train_images :**
存放训练集图片的路径,如果设置为None,ctc_reader会自动下载使用默认数据集。如果使用自己的数据进行训练,需要修改该选项。默认为None。
**- -train_list :
**
存放训练集图片信息的list文件,如果设置为None,ctc_reader会自动下载使用默认数据集。如果使用自己的数据进行训练,需要修改该选项。默认为None。
**- -train_list :**
存放训练集图片信息的list文件,如果设置为None,ctc_reader会自动下载使用默认数据集。如果使用自己的数据进行训练,需要修改该选项。默认为None。
**- -test_images :
**
存放测试集图片的路径,如果设置为None,ctc_reader会自动下载使用默认数据集。如果使用自己的数据进行测试,需要修改该选项。默认为None。
**- -test_images :**
存放测试集图片的路径,如果设置为None,ctc_reader会自动下载使用默认数据集。如果使用自己的数据进行测试,需要修改该选项。默认为None。
**- -test_list :
**
存放测试集图片信息的list文件,如果设置为None,ctc_reader会自动下载使用默认数据集。如果使用自己的数据进行测试,需要修改该选项。默认为None。
**- -test_list :**
存放测试集图片信息的list文件,如果设置为None,ctc_reader会自动下载使用默认数据集。如果使用自己的数据进行测试,需要修改该选项。默认为None。
**- -num_classes :
**
字符集的大小。如果设置为None, 则使用ctc_reader提供的字符集大小。如果使用自己的数据进行训练,需要修改该选项。默认为None.
**- -num_classes :**
字符集的大小。如果设置为None, 则使用ctc_reader提供的字符集大小。如果使用自己的数据进行训练,需要修改该选项。默认为None.
### 1.3 Inference
### 1.3 Inference
...
@@ -163,13 +163,13 @@ python inference.py [options]
...
@@ -163,13 +163,13 @@ python inference.py [options]
其中,options支持配置以下预测相关的参数:
其中,options支持配置以下预测相关的参数:
**--model_path
:
**
用来做预测的模型文件。如果模型是以单个文件存储的,这里需要指定具体文件的路径;如果模型是以多个文件存储的,这里只需指定多个文件所在文件夹的路径。为必设置选项。
**--model_path
:
**
用来做预测的模型文件。如果模型是以单个文件存储的,这里需要指定具体文件的路径;如果模型是以多个文件存储的,这里只需指定多个文件所在文件夹的路径。为必设置选项。
**--input_images_dir
:
**
存放待预测图片的文件夹路径。如果设置为None, 则使用ctc_reader提供的默认数据。默认为None.
**--input_images_dir
:
**
存放待预测图片的文件夹路径。如果设置为None, 则使用ctc_reader提供的默认数据。默认为None.
**--input_images_list
:
**
存放待预测图片信息的list文件的路径。如果设置为None, 则使用ctc_reader提供的默认数据。默认为None.
**--input_images_list
:
**
存放待预测图片信息的list文件的路径。如果设置为None, 则使用ctc_reader提供的默认数据。默认为None.
**--device DEVICE
:
**
设备ID。设置为-1,运行在CPU上;设置为0,运行在GPU上。默认为0。
**--device DEVICE
:
**
设备ID。设置为-1,运行在CPU上;设置为0,运行在GPU上。默认为0。
预测结果会print到标准输出。
预测结果会print到标准输出。
...
@@ -183,10 +183,10 @@ python eval.py [options]
...
@@ -183,10 +183,10 @@ python eval.py [options]
其中,options支持配置以下评估相关的参数:
其中,options支持配置以下评估相关的参数:
**--model_path
:
**
待评估模型的文件路径。如果模型是以单个文件存储的,这里需要指定具体文件的路径;如果模型是以多个文件存储的,这里只需指定多个文件所在文件夹的路径。为必设置选项。
**--model_path
:
**
待评估模型的文件路径。如果模型是以单个文件存储的,这里需要指定具体文件的路径;如果模型是以多个文件存储的,这里只需指定多个文件所在文件夹的路径。为必设置选项。
**--input_images_dir
:
**
存放待评估图片的文件夹路径。如果设置为None, 则使用ctc_reader提供的默认数据。默认为None.
**--input_images_dir
:
**
存放待评估图片的文件夹路径。如果设置为None, 则使用ctc_reader提供的默认数据。默认为None.
**--input_images_list
:
**
存放待评估图片信息的list文件的路径。如果设置为None, 则使用ctc_reader提供的默认数据。默认为None.
**--input_images_list
:
**
存放待评估图片信息的list文件的路径。如果设置为None, 则使用ctc_reader提供的默认数据。默认为None.
**--device DEVICE
:
**
设备ID。设置为-1,运行在CPU上;设置为0,运行在GPU上。默认为0。
**--device DEVICE
:
**
设备ID。设置为-1,运行在CPU上;设置为0,运行在GPU上。默认为0。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录