Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • Paddle
  • Issue
  • #18921

P
Paddle
  • 项目概览

PaddlePaddle / Paddle
大约 2 年 前同步成功

通知 2325
Star 20933
Fork 5424
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 1423
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 543
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
P
Paddle
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 1,423
    • Issue 1,423
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 543
    • 合并请求 543
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板
已关闭
开放中
Opened 7月 31, 2019 by saxon_zh@saxon_zhGuest

分布式训练模型初始化问题

Created by: zhaoyang1708

用paddle cloud提交任务训练模型,没有用初始化时可以正常训练,用下面初始化模型的时候都会报错 init_model_path=/app/ecom/native-ad/zhaoyang29/reward_video_nnq/xcxxs/fluidmodel/output/ab28ea5e-cb8b-50b6-9503-b447b99aabed/job-0bb5d31881d04ac9/output/rank-00000/pass-9/ 报错:F0731 03:18:58.043956 37734 grpc_client.cc:418] GetRPC name:[sequence_conv_4.b_0], ep:[10.182.76.151:62004], status:[-1] meets grpc error, error_code:14 error_message:Socket closed error_details:

* Check failure stack trace: *

@ 0x7f5187709c0d google::LogMessage::Fail() @ 0x7f518770d6bc google::LogMessage::SendToLog() @ 0x7f5187709733 google::LogMessage::Flush() @ 0x7f518770ebce google::LogMessageFatal::~LogMessageFatal() @ 0x7f518830ee0e paddle::operators::distributed::GRPCClient::Proceed() @ 0x7f5191e008a0 execute_native_thread_routine @ 0x7f522c78c1c3 start_thread @ 0x7f522bdb412d __clone @ (nil) (unknown) 请问是我初始化有问题吗还是什么原因
指派人
分配到
无
里程碑
无
分配里程碑
工时统计
无
截止日期
无
标识: paddlepaddle/Paddle#18921
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7