Created by: smoothcobble
在训练数据相同的情况下,本地和集群每轮的cost相差较大,本地效果明显优于集群,即使集群只使用1个节点。从本地迁移到集群,如果仅使用单节点,除了
trainer = paddle.trainer.SGD(cost=cost, parameters=parameters, update_equation=optimizer, is_local=not cluster_train)
中is_local置为False外,还有其他需要特别注意的么?