Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • ERNIE
  • Issue
  • #222

E
ERNIE
  • 项目概览

PaddlePaddle / ERNIE
接近 2 年 前同步成功

通知 113
Star 5997
Fork 1271
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 29
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 0
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
E
ERNIE
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 29
    • Issue 29
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 0
    • 合并请求 0
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板
已关闭
开放中
Opened 7月 24, 2019 by saxon_zh@saxon_zhGuest

BERT、ERNIE、TextCNN做文本分类任务性能对比

Created by: Biaocsu

以下模型的推理速度、内存占用等均在‘CPU’上考察 【TextCNN、pytorch_bert、tensorflow_bert、ERNIE文本分类任务性能对比】 【以下性能考察结果均经过多次测试】

推理时的数据最长文本有75万中文字符,利用100个文本进行测试。 从内存占用及推理速度指标来看,四种算法中,TextCNN均是最优的。 由于bert及ERNIE并未经过多次fine-tune就已经达到较好泛化效果,因此可以认为其泛化能力会相对textcnn更好些。 pytorch_bert、tensorflow_bert、ERNIE三者相比较,在内存占用方面相差不是很大;但ERNIE在推理速度方面稍差(这个蛮重要),不过ERNIE版本更新很快、另可直接联系其工作团队解答疑问 长文本预测时,尝试了将文本截断(例如:文本长度100000, 则分n=100000//510次)预测,因为长文本前510长度有可能没有重要信息。(例如:【‘娱乐’, ‘赌博’】二分类,截断n次,只要有一次预测为‘赌博’那文本就是赌博类别)

【TextCNN】 推理时模型占用内存大约:546M(稳定) 推理时预测一个文件(完整长文本)平均所需时间:0.095s 多次训练,保存泛化效果最好模型,其在测试集上准确率:95.312%

【Pytorch_bert】 推理时模型占用内存:942M(峰值) 推理时预测一个文本(前128+后382字符)平均所需时间:1.149S 推理时预测一个文本(前510 * 1长度+尾部数据;相当于预测截断成n个510文本)平均所需时间:2.658s 推理时预测一个文本(前510 * 2长度+尾部数据)平均所需时间:3.529s 推理时预测一个文本(前510 * 5长度+尾部数据)平均所需时间:5.233s 推理时预测一个文本(完整长文本)平均所需时间:38.77s fine-tune模型,其在测试集上准确率:98.82%

【tensorflow_bert】 推理时模型占用内存:988M(峰值) 推理时预测一个文本(前128+后382字符)平均所需时间:1.332S 推理时预测一个文本(前510 * 1长度+尾部数据)平均所需时间:1.485s 推理时预测一个文本(前510 * 2长度+尾部数据)平均所需时间:3.570s 推理时预测一个文本(前510 * 5长度+尾部数据)平均所需时间:7.033s 推理时预测一个文本(完整长文本)平均所需时间:56.18s fine-tune模型(调节的参数与pytorch_bert一致),其在测试集上准确率:98.90%

【ERNIE】 推理时模型占用内存:1072M(峰值) 推理时预测一个文本(前128+后382字符)平均所需时间:2.227s 推理时预测一个文本(前510 * 1长度+尾部数据)平均所需时间:3.934s 推理时预测一个文本(前510 * 2长度+尾部数据)平均所需时间:6.001s 推理时预测一个文本(前510 * 5长度+尾部数据)平均所需时间:9.835s 推理时预测一个文本(完整长文本)平均所需时间: fine-tune模型,其在测试集上准确率:98.74%

指派人
分配到
无
里程碑
无
分配里程碑
工时统计
无
截止日期
无
标识: paddlepaddle/ERNIE#222
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7