Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • PaddleX
  • Issue
  • #251

P
PaddleX
  • 项目概览

PaddlePaddle / PaddleX

通知 138
Star 4
Fork 0
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 43
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 5
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
P
PaddleX
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 43
    • Issue 43
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 5
    • 合并请求 5
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板
已关闭
开放中
Opened 7月 29, 2020 by saxon_zh@saxon_zhGuest

paddlex训练的模型在Jetson nano上用python API部署报错

Created by: jedibobo

硬件环境是Jetson nano JetPack4.3 Cuda10.0 Cudnn 7.6.3 python环境是安装paddlepaddle-gpu==2.0.0alpha0(自己编译的) 并安装了paddlex,由于有找不到opencv的报错(实际上有,通过ln过去的),我按照--no-dependencies的方式一个个包安装。 模型训练使用Aistudio的https://aistudio.baidu.com/aistudio/projectdetail/633900进行训练 我用文档中的方法对模型进行了裁剪训练。 image 训练代码: num_classes = len(train_dataset.labels) print('class num:', num_classes) model = pdx.det.YOLOv3(num_classes=num_classes, backbone='MobileNetV3_large', anchors=anchor_sizes) model.train( num_epochs=20, train_dataset=train_dataset, train_batch_size=4, eval_dataset=eval_dataset, learning_rate=0.00025, lr_decay_epochs=[10, 15], save_interval_epochs=2, log_interval_steps=100, save_dir='./yolov3_mobilenetv3_prune', pretrain_weights='./yolov3_MobileNetV3_large/best_model', # pretrain_weights='IMAGENET', use_vdl=True, sensitivities_file='./sensitivities.data', eval_metric_loss=0.10)

之后导出为Inference模型:(想用trt固定了输入大小) !paddlex --export_inference --model_dir=./yolov3_mobilenetv3_prune/best_model --save_dir=./yolov3_mobilenetv3_inference_model --fixed_input_shape=[512,512]

实际部署的时候报错如下: Traceback (most recent call last): File "test.py", line 20, in result = model.predict(image_name, eval_transforms) File "/home/dlinano/envs/paddle4-paddlex/lib/python3.6/site-packages/paddlex/deploy.py", line 235, in predict model_pred = self.raw_predict(preprocessed_input) File "/home/dlinano/envs/paddle4-paddlex/lib/python3.6/site-packages/paddlex/deploy.py", line 217, in raw_predict self.predictor.zero_copy_run() RuntimeError: parallel_for failed: too many resources requested for launch

在Paddle的issue里面的不完整解答说是硬件资源不足?我认为比较没有说服力,目前模型导出后大概30M,之前尝试过200多M大小的模型的部署也未出现这种问题。请问有什么比较好的解决方法吗? image

指派人
分配到
无
里程碑
无
分配里程碑
工时统计
无
截止日期
无
标识: paddlepaddle/PaddleX#251
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7