Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • PaddleRec
  • Issue
  • #153

P
PaddleRec
  • 项目概览

PaddlePaddle / PaddleRec

通知 68
Star 12
Fork 5
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 27
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 10
  • Wiki 1
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
P
PaddleRec
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 27
    • Issue 27
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 10
    • 合并请求 10
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 1
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板
已关闭
开放中
Opened 7月 22, 2020 by saxon_zh@saxon_zhGuest

分布式任务提交中遇到若干问题

Created by: MrChengmo

1:文档只给出MPI_CPU的submit demo,未给出K8S_CPU\K8S_GPU的submit demo。

2:pip install paddlepaddle-gpu==1.7.2 --index-url=http://pip.baidu.com/pypi/simple --trusted-host pip.baidu.com mpi_cpu模式不需要gpu

3:如何在paddlecloud运行py3未给出说明,有两种方式:①:通过添加一个run.sh,在里面配置PATH 和执行python -m paddlerec.run -m config.yaml②:通过在config.ini中添加use_python3=1

4:FLAGS_communicator_max_merge_var_num: 5这个Flags说明一下,在sync和half_async时,需要和cpu_num个数相同。

5:个人感觉可以将backend.yaml文件中的内容全部放到config.yaml中,backend.yaml中重要是一个配置config和summit提交job作业,没有必要单独弄一个backend.yaml,只留一个config.yaml文档说明清楚如何配置提交到cloud的config和summit即可,这样从单机单卡、单机多卡、local_cluster\cluster都可以只用config.yaml,简洁明了;

6:现在cluster模式,只能支持train,未添加infer相关功能。 需求:PaddleRec分布式预测功能添加。

7:config.ini中的cpu_num默认等于1,如何通过backend.yaml控制cpu_num的值?文档需给出明确说明。

指派人
分配到
无
里程碑
无
分配里程碑
工时统计
无
截止日期
无
标识: paddlepaddle/PaddleRec#153
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7