关于组合优化策略的一个问题
Created by: mrhan36
【训练环境】
环境:aistudio python版本:3.7 paddlehub版本:1.7.0 模型:se_resnext101_32x4d_imagenet 任务:通过迁移学习,训练最佳预测模型
【我的问题】
问题1: 为进行模型调优,得到最优预测模型,计划对以下8个参数在不同取值组合下做正交实验,观察各组合准确率。我的困惑是,以下各优化器(SGD,ADAM等)和其他7个参数之间,以及1-7各参数之间是否可以任意组合,是否存在在理论上不适合组合的地方。
问题2: 以下各参数取值是在小样本数据上实施单因素预实验(将其他参数设置为None或paddlehub默认值)后筛选确定的acc较高的代表性的参数值。请问依您的经验,以下参数取值是否有明显不合理的地方。该实验数据要写在英文论文中,是核心实验部分,文中会提到paddlepaddle和Aistudio平台,所以希望能严谨呈现,为避免犯低级错误,所以来此处寻求帮助,谢谢!
由于数据量较大,各组合确定后,下一步实验会耗费大量计算资源和时间(单卡训练需要20天完成实验),所以请专家给把把关,谢谢!
- 【Batch_size】:16,32,64
- 【学习率(learning_rate)】:0.001,0.0001,0.00005
- 【权重衰减(weight_decay)】:0.0001,0.0005,0.001
- 【gradual_unfreeze】:3,5,7
- 【slanted_triangle-cut_fraction】:0.05,0.1,0.2
- 【Discrimitive-blocks】:2,3,5
- 【Clip】:1,2,3
- 【优化器(optimizer)】:sgd,adam,adagrad,adamax,decayedadagrad,rmsprop