Paddle应当如何提供云服务
Created by: wangkuiyi
在 https://github.com/PaddlePaddle/Paddle/issues/594 里,大家在讨论未来Paddle应该是什么形态。
这个讨论应该和Paddle未来如何支持公有云一起思考。
我想到两个路子,请大家看看:
-
提供一个文档,教大家如何在各个公有云上申请一组机器,然后再上面部署Paddle。其中一台机器有external IP,这台机器上运行一个Paddle master process。用户的笔记本上执行的Python程序可以通过Restful API连接这个master process,提交作业,由master后面接着的多个worker processes以及parameter server processes来执行。这个设计会让Paddle变得很复杂,因为每一组 master/workers/pservers 要能执行来自多个用户的多个jobs。
-
提供一个机群,部署好Kubernetes。另外提供一个Web服务,用户可以在上面申请由Paddle的跟CA签名的自己的CA,然后用这个CA以及kubectl来启动一组Paddle master/worker/pservers 来执行一个job。
抛砖引玉。具体结果很可能是这两个选择之外的。欢迎大家讨论。