Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • Paddle
  • Issue
  • #448

P
Paddle
  • 项目概览

PaddlePaddle / Paddle
大约 2 年 前同步成功

通知 2325
Star 20933
Fork 5424
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 1423
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 543
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
P
Paddle
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 1,423
    • Issue 1,423
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 543
    • 合并请求 543
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板
已关闭
开放中
Opened 11月 12, 2016 by saxon_zh@saxon_zhGuest

训练时候只有1000条测试样本, tester却显示有124W条

Created by: linrongyi

我split了1000条样本作为dev set, 可是在训练过程中, 打印出来的tester信息显示有100多W条. 在test过程中, 停顿了许久, 所以应该是eval了这么多条数据.

我训练的命令是

${TRAINER_BIN} \
	--job=train \
	--config=trainer_config.conf \
	--save_dir=output \
	--trainer_count=11 \
	--use_gpu=0 \
	--save_dir=./output.${TAG} \
	--dot_period=100 \
	--log_period=1000 \
	--test_period=10000 \
	--num_passes=15 \
	--init_model_path=./model.init \
	--load_missing_parameter_strategy=rand \
	--test_wait=1  --show_parameter_stats_period=1000

打印出来的log

I1112 16:08:26.652833  8142 TrainerInternal.cpp:182]  Pass=0 Batch=15091 samples=1931613 AvgCost=0.481067 Eval: err_rate_out1=0.0968464 
I1112 16:09:07.795814  8142 Tester.cpp:127]  Test samples=1248750 cost=0.488171 Eval: err_rate_out1=0.0605288 

我在dataprovider里面打了debug, 确认data_provider只load了1000条数据

0 insts loaded
0 insts loaded
[999] instances loaded from /home/aladdin/paddle_tasks/tagging/data/caipu.refined.test [load结束打出的日志]
100000 insts loaded
200000 insts loaded
300000 insts loaded
400000 insts loaded
500000 insts loaded
I1112 16:04:13.903460  8165 ThreadLocal.cpp:37] thread use undeterministic rand seed:8166
...600000 insts loaded
....700000 insts loaded
指派人
分配到
无
里程碑
无
分配里程碑
工时统计
无
截止日期
无
标识: paddlepaddle/Paddle#448
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7