Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
ERNIE
提交
eab02e8e
E
ERNIE
项目概览
PaddlePaddle
/
ERNIE
9 个月 前同步成功
通知
107
Star
5997
Fork
1270
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
29
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
E
ERNIE
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
29
Issue
29
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
未验证
提交
eab02e8e
编写于
5月 20, 2022
作者:
T
Tesla
提交者:
GitHub
5月 20, 2022
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update README.md
上级
5a10129b
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
1 addition
and
1 deletion
+1
-1
applications/tasks/data_distillation/README.md
applications/tasks/data_distillation/README.md
+1
-1
未找到文件。
applications/tasks/data_distillation/README.md
浏览文件 @
eab02e8e
...
...
@@ -47,7 +47,7 @@ data_distillation/
## 数据准备
-
目前采用三种数据增强策略策略,对于不用的任务可以特定的比例混合。三种
[
数据增强
](
../../tools/data/data_aug
/README.md
)
策略包括:
-
目前采用三种数据增强策略策略,对于不用的任务可以特定的比例混合。三种
[
数据增强
](
../../tools/data/data_aug
)
策略包括:
-
添加噪声:对原始样本中的词,以一定的概率(如0.1)替换为”UNK”标签
-
同词性词替换:对原始样本中的所有词,以一定的概率(如0.1)替换为本数据集中随机一个同词性的词
-
N-sampling:从原始样本中,随机选取位置截取长度为m的片段作为新的样本,其中片段的长度m为0到原始样本长度之间的随机值
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录