Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
ERNIE
提交
565912c9
E
ERNIE
项目概览
PaddlePaddle
/
ERNIE
大约 1 年 前同步成功
通知
109
Star
5997
Fork
1270
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
29
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
E
ERNIE
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
29
Issue
29
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
565912c9
编写于
3月 14, 2019
作者:
T
tianxin04
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update readme
上级
778b9951
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
81 addition
and
68 deletion
+81
-68
ERNIE/README.md
ERNIE/README.md
+81
-68
未找到文件。
ERNIE/README.md
浏览文件 @
565912c9
...
...
@@ -10,136 +10,149 @@
在 *Bert* 模型中,我们通过『哈』与『滨』的局部共现,即可判断出『尔』字,模型没有学习与『哈尔滨』相关的任何知识。而 *Ernie* 通过学习词与实体的表达,使模型能够建模出『哈尔滨』与『黑龙江』的关系,学到『哈尔滨』是 『黑龙江』的省会以及『哈尔滨』是个冰雪城市。
此外,
*Ernie*
引入了百科、新闻、论坛回帖等多源中文语料进行训练
。
训练数据方面,百科类、资讯类中文语料外,*Ernie* 还引入了论坛对话类数据,利用 **DLM**(Dialogue Language Model)建模 Query-Response 对话结构,将对话 Pair 对作为输入,引入 Dialogue Embedding 标识对话的角色,利用 Dialogue Response Loss 学习对话的隐式关系,进一步提升模型的语义表示能力
。
我们在
多个公开的中文数据集合上进行了效果验证,
*Ernie*
模型相较
*Bert*
,
取得了更好的效果。
我们在
自然语言推断,语义相似度,命名实体识别,情感分析,问答匹配 5 个公开的中文数据集合上进行了效果验证,*Ernie* 模型相较 *Bert*
取得了更好的效果。
<table
style=
"margin-left: 30.0px;"
>
<tbody
style=
"margin-left: 30.0px;"
>
<tr
style=
"margin-left: 30.0px;"
>
<th
class=
"confluenceTh"
><strong>
数据集
</strong>
<table>
<tbody>
<tr>
<th><strong>数据集</strong>
<br></th>
<th
style=
"text-align: center;margin-left: 30.0px;"
colspan=
"2"
><strong>
xnli
</strong></th>
<th
style=
"text-align: center;margin-left: 30.0px;"
colspan=
"2"
><strong>
lcqmc
</strong></th>
<th
style=
"text-align: center;margin-left: 30.0px;"
colspan=
"2"
><strong>
msra ner
</strong></th>
<th
style=
"text-align: center;margin-left: 30.0px;"
colspan=
"2"
><strong>
chnsentic
orp
</strong></th>
<th
style=
"text-align: center;margin-left: 30.0px;"
colspan=
"4"
><strong>
nlpcc-dbqa
</strong></th></tr>
<tr
style=
"margin-left: 30.0px;"
>
<td
rowspan=
"2"
>
<th
colspan="2"><strong>XNLI
</strong></th>
<th
colspan="2"><strong>LCQMC
</strong></th>
<th
colspan="2"><strong>MSRA-NER
</strong></th>
<th
colspan="2"><strong>ChnSentiC
orp</strong></th>
<th colspan="4"><strong>nlpcc-dbqa</strong></th></tr>
<tr>
<td rowspan="2">
<p>
<strong>评估</strong></p>
<p>
<strong>指标</strong>
<br></p>
</td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"2"
>
<td colspan="2">
<strong>acc</strong>
<br></td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"2"
>
<td colspan="2">
<strong>acc</strong>
<br></td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"2"
>
<td colspan="2">
<strong>f1-score</strong>
<br></td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"2"
>
<td colspan="2">
<strong>acc</strong>
<strong></strong>
<br></td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"2"
>
<td colspan="2">
<strong>mrr</strong>
<br></td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"2"
>
<td colspan="2">
<strong>f1-score</strong>
<br></td>
</tr>
<tr
style=
"margin-left: 30.0px;"
>
<t
d
colspan=
"1"
style=
"text-align: center;
"
width=
""
>
<tr>
<t
h colspan="1
" width="">
<strong>dev</strong>
<br></t
d
>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<br></t
h
>
<td colspan="1" width="">
<strong>test</strong>
<br></td>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<td colspan="1" width="">
<strong>dev</strong>
<br></td>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<td colspan="1" width="">
<strong>test</strong>
<br></td>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<td colspan="1" width="">
<strong>dev</strong>
<br></td>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<td colspan="1" width="">
<strong>test</strong>
<br></td>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<td colspan="1" width="">
<strong>dev</strong>
<br></td>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<td colspan="1" width="">
<strong>test</strong>
<br></td>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<td colspan="1" width="">
<strong>dev</strong>
<br></td>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<td colspan="1" width="">
<strong>test</strong>
<br></td>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<td colspan="1" width="">
<strong>dev</strong>
<br></td>
<td
colspan=
"1"
style=
"text-align: center;"
width=
""
>
<td colspan="1" width="">
<strong>test</strong>
<br></td>
</tr>
<tr
style=
"margin-left: 30.0px;"
>
<td
style=
"margin-left: 30.0px;"
>
<tr>
<td>
<strong>Bert
<br></strong></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
78.1
</td>
<td
style=
"margin-left: 30px; text-align: center;"
>
77.2
</td>
<td
style=
"margin-left: 30px; text-align: center;"
>
88.8
</td>
<td
style=
"margin-left: 30px; text-align: center;"
>
87.0
</td>
<td
style=
"margin-left: 30px; text-align: center;"
>
94.0
<td>78.1</td>
<td>77.2</td>
<td>88.8</td>
<td>87.0</td>
<td>94.0
<br></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
<td>
<span>92.6</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
94.6
</td>
<td
style=
"margin-left: 30px; text-align: center;"
>
94.3
</td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"1"
>
94.7
</td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"1"
>
94.6
</td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"1"
>
80.7
</td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"1"
>
80.8
</td></tr>
<tr
style=
"margin-left: 30.0px;"
>
<td
style=
"margin-left: 30.0px;"
>
<td>94.6</td>
<td>94.3</td>
<td colspan="1">94.7</td>
<td colspan="1">94.6</td>
<td colspan="1">80.7</td>
<td colspan="1">80.8</td></tr>
<tr>
<td>
<strong>Ernie
<br></strong></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
79.9
<span
style=
"color: red;"
>
(
<strong>
+1.8
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
78.4
<span
style=
"color: red;"
>
(
<strong>
+1.2
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
89.7
<span
style=
"color: red;"
>
(
<strong>
+0.9
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
87.4
<span
style=
"color: red;"
>
(
<strong>
+0.4
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
95.0
<span
style=
"color: red;"
>
(
<strong>
+1.0
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
93.8
<span
style=
"color: red;"
>
(
<strong>
+1.2
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
95.2
<span
style=
"color: red;"
>
(
<strong>
+0.6
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
>
95.4
<span
style=
"color: red;"
>
(
<strong>
+1.1
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"1"
>
95.0
<span
style=
"color: red;"
>
(
<strong>
+0.3
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"1"
>
95.1
<span
style=
"color: red;"
>
(
<strong>
+0.5
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"1"
>
82.3
<span
style=
"color: red;"
>
(
<strong>
+1.6
</strong>
)
</span></td>
<td
style=
"margin-left: 30px; text-align: center;"
colspan=
"1"
>
82.7
<span
style=
"color: red;"
>
(
<strong>
+1.9
</strong>
)
</span></td></tr>
<td
>79.9 <span
>(<strong>+1.8</strong>)</span></td>
<td
>78.4 <span
>(<strong>+1.2</strong>)</span></td>
<td
>89.7 <span
>(<strong>+0.9</strong>)</span></td>
<td
>87.4 <span
>(<strong>+0.4</strong>)</span></td>
<td
>95.0 <span
>(<strong>+1.0</strong>)</span></td>
<td
>93.8 <span
>(<strong>+1.2</strong>)</span></td>
<td
>95.2 <span
>(<strong>+0.6</strong>)</span></td>
<td
>95.4 <span
>(<strong>+1.1</strong>)</span></td>
<td
colspan="1">95.0 <span
>(<strong>+0.3</strong>)</span></td>
<td
colspan="1">95.1 <span
>(<strong>+0.5</strong>)</span></td>
<td
colspan="1">82.3 <span
>(<strong>+1.6</strong>)</span></td>
<td
colspan="1">82.7 <span
>(<strong>+1.9</strong>)</span></td></tr>
</tbody>
</table>
#### 数据集介绍
- **自然语言推断任务** XNLI
XNLI 由 Facebook 和纽约大学的研究者联合构建,旨在评测模型多语言的句子理解能力。目标是判断两个句子的关系(矛盾、中立、蕴含)。
[
链接
](
https://github.com/facebookresearch/XNLI
)
-
**语义匹配任务**
LCQMC
LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问答匹配数据集其目,标是判断两个问题的语义是否相同。
[
链接
](
http://aclweb.org/anthology/C18-1166
)
```
text
XNLI 由 Facebook 和纽约大学的研究者联合构建,旨在评测模型多语言的句子理解能力。目标是判断两个句子的关系(矛盾、中立、蕴含)。[链接: https://github.com/facebookresearch/XNLI]
```
- **语义相似度** LCQMC
```
text
LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问答匹配数据集其目,标是判断两个问题的语义是否相同。[链接: http://aclweb.org/anthology/C18-1166]
```
- **命名实体识别任务** MSRA-NER
MSRA-NER 数据集由微软亚研院发布,其目标是命名实体识别,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名等。
[
链接
](
http://sighan.cs.uchicago.edu/bakeoff2005/
)
```
text
MSRA-NER 数据集由微软亚研院发布,其目标是命名实体识别,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名等。[链接: http://sighan.cs.uchicago.edu/bakeoff2005/]
```
- **情感分析任务** ChnSentiCorp
```
text
ChnSentiCorp 是中文情感分析数据集,其目标是判断一段话的情感态度。
```
- **检索式问答任务** nlpcc-dbqa
nlpcc-dbqa是由国际自然语言处理和中文计算会议NLPCC于2016年举办的评测任务,其目标是选择能够回答问题的答案。
[
链接
](
http://tcci.ccf.org.cn/conference/2016/dldoc/evagline2.pdf
)
```text
nlpcc-dbqa是由国际自然语言处理和中文计算会议NLPCC于2016年举办的评测任务,其目标是选择能够回答问题的答案。[链接: http://tcci.ccf.org.cn/conference/2016/dldoc/evagline2.pdf]
```
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录