Skip to content

  • 体验新版
    • 正在加载...
  • 登录
  • PaddlePaddle
  • ERNIE
  • Issue
  • #398

E
ERNIE
  • 项目概览

PaddlePaddle / ERNIE
大约 2 年 前同步成功

通知 115
Star 5997
Fork 1271
  • 代码
    • 文件
    • 提交
    • 分支
    • Tags
    • 贡献者
    • 分支图
    • Diff
  • Issue 29
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 0
  • Wiki 0
    • Wiki
  • 分析
    • 仓库
    • DevOps
  • 项目成员
  • Pages
E
ERNIE
  • 项目概览
    • 项目概览
    • 详情
    • 发布
  • 仓库
    • 仓库
    • 文件
    • 提交
    • 分支
    • 标签
    • 贡献者
    • 分支图
    • 比较
  • Issue 29
    • Issue 29
    • 列表
    • 看板
    • 标记
    • 里程碑
  • 合并请求 0
    • 合并请求 0
  • Pages
  • 分析
    • 分析
    • 仓库分析
    • DevOps
  • Wiki 0
    • Wiki
  • 成员
    • 成员
  • 收起侧边栏
  • 动态
  • 分支图
  • 创建新Issue
  • 提交
  • Issue看板
已关闭
开放中
Opened 1月 08, 2020 by saxon_zh@saxon_zhGuest

ernie tiny模型pretrain问题

Created by: leyiwang

你好,因为现实中的任务场景比较复杂,非单一的文本分类和序列标注任务。和想使用特定领域的语料对ernie tiny进行无监督的pretrain。参考了README中关于预训练的说明:[预训练 (ERNIE 1.0)](https://github.com/PaddlePaddle/ERNIE/blob/develop/README.zh.md#%E9%A2%84%E8%AE%AD%E7%BB%83-ernie-10),对金融财务的语料做了预处理。因为要对原ernie tiny模型进行训练,所以使用了sentence piece做tokenize。最终将一个样本表示成“;”分割5部分存储到gz压缩文件中。其中,因为ernie tiny本身是词语粒度的,所以seg_labels中除了SPE和CLS外的位置都设为了0,即都做词首处理。

将词表指定为ernie tiny的词表,使用script/pretrain.sh脚本训练,并将ernie_config_path指定为ernie tiny的。启动训练任务后,学习率正常,大于0; 但是,当添加 --init_checkpoint ./config/params对ernie tiny模型参数初始化时,发现打印出的日志中每次迭代学习率都是0?

指派人
分配到
无
里程碑
无
分配里程碑
工时统计
无
截止日期
无
标识: paddlepaddle/ERNIE#398
渝ICP备2023009037号

京公网安备11010502055752号

网络110报警服务 Powered by GitLab CE v13.7
开源知识
Git 入门 Pro Git 电子书 在线学 Git
Markdown 基础入门 IT 技术知识开源图谱
帮助
使用手册 反馈建议 博客
《GitCode 隐私声明》 《GitCode 服务条款》 关于GitCode
Powered by GitLab CE v13.7