paddle v2训练有CTC层时 输入数据类别的设置
Created by: xieshufu
在PADDLE v2上做一个OCR模型的训练, 字符数是95类,由于用到了CTC层,在设置类别的时候会设置为96类(95+1). 输入数据类别数目该如何设置?是设置为classdim还是classdim+1?
lbl = paddle.layer.data(
name="label", type=paddle.data_type.integer_value_sequence(classdim))
相关设置如下:
classdim = 95
output = ocr_4conv_net(image, classdim+1)
lbl = paddle.layer.data(
name="label", type=paddle.data_type.integer_value_sequence(classdim))
cost = paddle.layer.warp_ctc(input=output,
label=lbl,
size=classdim+1,
blank=classdim,
norm_by_times=True)
ctc_eval = paddle.evaluator.ctc_error(input=output, label=lbl)