Created by: Kendraqian
请教一下,想做一个从多个目标中选出最优的几个目标,进行一项任务的完成,获取最高的收益,这种类似于组合优化中的背包问题,请问有相关的算法或者论文的推荐吗,希望能用上强化学习或者新的学习方法。