Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • PaddleHub
  • Issue
  • #631

P
PaddleHub
  • 项目概览

PaddlePaddle / PaddleHub
大约 2 年 前同步成功

通知 285
Star 12117
Fork 2091
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 200
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 4
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
P
PaddleHub
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 200
    • Issue 200
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 4
    • 合并请求 4
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板
已关闭
开放中
Opened 5月 27, 2020 by saxon_zh@saxon_zhGuest

关于组合优化策略的一个问题

Created by: mrhan36

【训练环境】

环境:aistudio python版本:3.7 paddlehub版本:1.7.0 模型:se_resnext101_32x4d_imagenet 任务:通过迁移学习,训练最佳预测模型

【我的问题】

问题1: 为进行模型调优,得到最优预测模型,计划对以下8个参数在不同取值组合下做正交实验,观察各组合准确率。我的困惑是,以下各优化器(SGD,ADAM等)和其他7个参数之间,以及1-7各参数之间是否可以任意组合,是否存在在理论上不适合组合的地方。

问题2: 以下各参数取值是在小样本数据上实施单因素预实验(将其他参数设置为None或paddlehub默认值)后筛选确定的acc较高的代表性的参数值。请问依您的经验,以下参数取值是否有明显不合理的地方。该实验数据要写在英文论文中,是核心实验部分,文中会提到paddlepaddle和Aistudio平台,所以希望能严谨呈现,为避免犯低级错误,所以来此处寻求帮助,谢谢!

由于数据量较大,各组合确定后,下一步实验会耗费大量计算资源和时间(单卡训练需要20天完成实验),所以请专家给把把关,谢谢!

  1. 【Batch_size】:16,32,64
  2. 【学习率(learning_rate)】:0.001,0.0001,0.00005
  3. 【权重衰减(weight_decay)】:0.0001,0.0005,0.001
  4. 【gradual_unfreeze】:3,5,7
  5. 【slanted_triangle-cut_fraction】:0.05,0.1,0.2
  6. 【Discrimitive-blocks】:2,3,5
  7. 【Clip】:1,2,3
  8. 【优化器(optimizer)】:sgd,adam,adagrad,adamax,decayedadagrad,rmsprop

谢谢!

指派人
分配到
无
里程碑
无
分配里程碑
工时统计
无
截止日期
无
标识: paddlepaddle/PaddleHub#631
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7