Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
models
提交
3eebc615
M
models
项目概览
PaddlePaddle
/
models
大约 1 年 前同步成功
通知
222
Star
6828
Fork
2962
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
602
列表
看板
标记
里程碑
合并请求
255
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
M
models
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
602
Issue
602
列表
看板
标记
里程碑
合并请求
255
合并请求
255
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
3eebc615
编写于
12月 18, 2020
作者:
S
smallv0221
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix readme and change cross-entropy api
上级
bec2933a
变更
8
隐藏空白更改
内联
并排
Showing
8 changed file
with
32 addition
and
23 deletion
+32
-23
PaddleNLP/examples/language_model/rnnlm/README.md
PaddleNLP/examples/language_model/rnnlm/README.md
+16
-2
PaddleNLP/examples/language_model/rnnlm/model.py
PaddleNLP/examples/language_model/rnnlm/model.py
+2
-3
PaddleNLP/examples/machine_reading_comprehension/DuReader-robust/README.md
...s/machine_reading_comprehension/DuReader-robust/README.md
+1
-1
PaddleNLP/examples/machine_reading_comprehension/DuReader-robust/run_du.py
...s/machine_reading_comprehension/DuReader-robust/run_du.py
+4
-6
PaddleNLP/examples/machine_reading_comprehension/DuReader-yesno/README.md
...es/machine_reading_comprehension/DuReader-yesno/README.md
+1
-1
PaddleNLP/examples/machine_reading_comprehension/SQuAD/README.md
...LP/examples/machine_reading_comprehension/SQuAD/README.md
+2
-2
PaddleNLP/examples/machine_reading_comprehension/SQuAD/run_squad.py
...examples/machine_reading_comprehension/SQuAD/run_squad.py
+4
-6
PaddleNLP/paddlenlp/metrics/squad.py
PaddleNLP/paddlenlp/metrics/squad.py
+2
-2
未找到文件。
PaddleNLP/examples/language_model/rnnlm/README.md
浏览文件 @
3eebc615
...
@@ -5,8 +5,6 @@
...
@@ -5,8 +5,6 @@
## 1. 任务说明
## 1. 任务说明
本文主要介绍基于lstm的语言的模型的实现,给定一个输入词序列(中文分词、英文tokenize),计算其ppl(语言模型困惑度,用户表示句子的流利程度),基于循环神经网络语言模型的介绍可以
[
参阅论文
](
https://arxiv.org/abs/1409.2329
)
。相对于传统的方法,基于循环神经网络的方法能够更好的解决稀疏词的问题。
本文主要介绍基于lstm的语言的模型的实现,给定一个输入词序列(中文分词、英文tokenize),计算其ppl(语言模型困惑度,用户表示句子的流利程度),基于循环神经网络语言模型的介绍可以
[
参阅论文
](
https://arxiv.org/abs/1409.2329
)
。相对于传统的方法,基于循环神经网络的方法能够更好的解决稀疏词的问题。
**目前语言模型要求使用PaddlePaddle 2.0及以上版本或适当的develop版本。**
## 2. 效果说明
## 2. 效果说明
...
@@ -27,6 +25,22 @@
...
@@ -27,6 +25,22 @@
## 1. 开始第一次模型调用
## 1. 开始第一次模型调用
### 安装说明
*
PaddlePaddle 安装
本项目依赖于 PaddlePaddle 2.0-rc1 及以上版本,请参考
[
安装指南
](
http://www.paddlepaddle.org/#quick-start
)
进行安装
*
PaddleNLP 安装
```
shell
pip
install
paddlenlp>
=
2.0.0b
```
*
环境依赖
Python的版本要求 3.6+
### 数据准备
### 数据准备
为了方便开发者进行测试,我们内置了数据下载脚本,默认自动下载PTB数据集。
为了方便开发者进行测试,我们内置了数据下载脚本,默认自动下载PTB数据集。
...
...
PaddleNLP/examples/language_model/rnnlm/model.py
浏览文件 @
3eebc615
...
@@ -77,8 +77,8 @@ class CrossEntropyLossForLm(nn.Layer):
...
@@ -77,8 +77,8 @@ class CrossEntropyLossForLm(nn.Layer):
def
forward
(
self
,
y
,
label
):
def
forward
(
self
,
y
,
label
):
label
=
paddle
.
unsqueeze
(
label
,
axis
=
2
)
label
=
paddle
.
unsqueeze
(
label
,
axis
=
2
)
loss
=
paddle
.
nn
.
functional
.
softmax_with_
cross_entropy
(
loss
=
paddle
.
nn
.
functional
.
cross_entropy
(
logits
=
y
,
label
=
label
,
soft_label
=
False
)
input
=
y
,
label
=
label
,
reduction
=
'none'
)
loss
=
paddle
.
squeeze
(
loss
,
axis
=
[
2
])
loss
=
paddle
.
squeeze
(
loss
,
axis
=
[
2
])
loss
=
paddle
.
mean
(
loss
,
axis
=
[
0
])
loss
=
paddle
.
mean
(
loss
,
axis
=
[
0
])
loss
=
paddle
.
sum
(
loss
)
loss
=
paddle
.
sum
(
loss
)
...
@@ -89,4 +89,3 @@ class UpdateModel(paddle.callbacks.Callback):
...
@@ -89,4 +89,3 @@ class UpdateModel(paddle.callbacks.Callback):
# This callback reset model hidden states and update learning rate before each epoch begins
# This callback reset model hidden states and update learning rate before each epoch begins
def
on_epoch_begin
(
self
,
epoch
=
None
,
logs
=
None
):
def
on_epoch_begin
(
self
,
epoch
=
None
,
logs
=
None
):
self
.
model
.
network
.
reset_states
()
self
.
model
.
network
.
reset_states
()
PaddleNLP/examples/machine_reading_comprehension/DuReader-robust/README.md
浏览文件 @
3eebc615
...
@@ -27,7 +27,7 @@ DuReader-robust数据集是单篇章、抽取式阅读理解数据集,具体
...
@@ -27,7 +27,7 @@ DuReader-robust数据集是单篇章、抽取式阅读理解数据集,具体
*
PaddlePaddle 安装
*
PaddlePaddle 安装
本项目依赖于 PaddlePaddle 2.0 及以上版本,请参考
[
安装指南
](
http://www.paddlepaddle.org/#quick-start
)
进行安装
本项目依赖于 PaddlePaddle 2.0
-rc1
及以上版本,请参考
[
安装指南
](
http://www.paddlepaddle.org/#quick-start
)
进行安装
*
PaddleNLP 安装
*
PaddleNLP 安装
...
...
PaddleNLP/examples/machine_reading_comprehension/DuReader-robust/run_du.py
浏览文件 @
3eebc615
...
@@ -54,12 +54,10 @@ class CrossEntropyLossForSQuAD(paddle.nn.Layer):
...
@@ -54,12 +54,10 @@ class CrossEntropyLossForSQuAD(paddle.nn.Layer):
start_position
,
end_position
=
label
start_position
,
end_position
=
label
start_position
=
paddle
.
unsqueeze
(
start_position
,
axis
=-
1
)
start_position
=
paddle
.
unsqueeze
(
start_position
,
axis
=-
1
)
end_position
=
paddle
.
unsqueeze
(
end_position
,
axis
=-
1
)
end_position
=
paddle
.
unsqueeze
(
end_position
,
axis
=-
1
)
start_loss
=
paddle
.
nn
.
functional
.
softmax_with_cross_entropy
(
start_loss
=
paddle
.
nn
.
functional
.
cross_entropy
(
logits
=
start_logits
,
label
=
start_position
,
soft_label
=
False
)
input
=
start_logits
,
label
=
start_position
)
start_loss
=
paddle
.
mean
(
start_loss
)
end_loss
=
paddle
.
nn
.
functional
.
cross_entropy
(
end_loss
=
paddle
.
nn
.
functional
.
softmax_with_cross_entropy
(
input
=
end_logits
,
label
=
end_position
)
logits
=
end_logits
,
label
=
end_position
,
soft_label
=
False
)
end_loss
=
paddle
.
mean
(
end_loss
)
loss
=
(
start_loss
+
end_loss
)
/
2
loss
=
(
start_loss
+
end_loss
)
/
2
return
loss
return
loss
...
...
PaddleNLP/examples/machine_reading_comprehension/DuReader-yesno/README.md
浏览文件 @
3eebc615
...
@@ -41,7 +41,7 @@
...
@@ -41,7 +41,7 @@
*
PaddlePaddle 安装
*
PaddlePaddle 安装
本项目依赖于 PaddlePaddle 2.0 及以上版本,请参考
[
安装指南
](
http://www.paddlepaddle.org/#quick-start
)
进行安装
本项目依赖于 PaddlePaddle 2.0
-rc1
及以上版本,请参考
[
安装指南
](
http://www.paddlepaddle.org/#quick-start
)
进行安装
*
PaddleNLP 安装
*
PaddleNLP 安装
...
...
PaddleNLP/examples/machine_reading_comprehension/SQuAD/README.md
浏览文件 @
3eebc615
...
@@ -27,7 +27,7 @@ SQuAD v2.0
...
@@ -27,7 +27,7 @@ SQuAD v2.0
*
PaddlePaddle 安装
*
PaddlePaddle 安装
本项目依赖于 PaddlePaddle 2.0 及以上版本,请参考
[
安装指南
](
http://www.paddlepaddle.org/#quick-start
)
进行安装
本项目依赖于 PaddlePaddle 2.0
-rc1
及以上版本,请参考
[
安装指南
](
http://www.paddlepaddle.org/#quick-start
)
进行安装
*
PaddleNLP 安装
*
PaddleNLP 安装
...
@@ -56,7 +56,7 @@ python -u ./run_squad.py \
...
@@ -56,7 +56,7 @@ python -u ./run_squad.py \
--batch_size
12
\
--batch_size
12
\
--learning_rate
3e-5
\
--learning_rate
3e-5
\
--num_train_epochs
2
\
--num_train_epochs
2
\
--logging_steps
100
0
\
--logging_steps
100
\
--save_steps
1000
\
--save_steps
1000
\
--warmup_proportion
0.1
\
--warmup_proportion
0.1
\
--weight_decay
0.01
\
--weight_decay
0.01
\
...
...
PaddleNLP/examples/machine_reading_comprehension/SQuAD/run_squad.py
浏览文件 @
3eebc615
...
@@ -51,12 +51,10 @@ class CrossEntropyLossForSQuAD(paddle.nn.Layer):
...
@@ -51,12 +51,10 @@ class CrossEntropyLossForSQuAD(paddle.nn.Layer):
start_position
,
end_position
=
label
start_position
,
end_position
=
label
start_position
=
paddle
.
unsqueeze
(
start_position
,
axis
=-
1
)
start_position
=
paddle
.
unsqueeze
(
start_position
,
axis
=-
1
)
end_position
=
paddle
.
unsqueeze
(
end_position
,
axis
=-
1
)
end_position
=
paddle
.
unsqueeze
(
end_position
,
axis
=-
1
)
start_loss
=
paddle
.
nn
.
functional
.
softmax_with_cross_entropy
(
start_loss
=
paddle
.
nn
.
functional
.
cross_entropy
(
logits
=
start_logits
,
label
=
start_position
,
soft_label
=
False
)
input
=
start_logits
,
label
=
start_position
)
start_loss
=
paddle
.
mean
(
start_loss
)
end_loss
=
paddle
.
nn
.
functional
.
cross_entropy
(
end_loss
=
paddle
.
nn
.
functional
.
softmax_with_cross_entropy
(
input
=
end_logits
,
label
=
end_position
)
logits
=
end_logits
,
label
=
end_position
,
soft_label
=
False
)
end_loss
=
paddle
.
mean
(
end_loss
)
loss
=
(
start_loss
+
end_loss
)
/
2
loss
=
(
start_loss
+
end_loss
)
/
2
return
loss
return
loss
...
...
PaddleNLP/paddlenlp/metrics/squad.py
浏览文件 @
3eebc615
...
@@ -378,8 +378,8 @@ def compute_f1(a_gold, a_pred, is_whitespace_splited=True):
...
@@ -378,8 +378,8 @@ def compute_f1(a_gold, a_pred, is_whitespace_splited=True):
pred_toks
=
normalize_answer
(
a_pred
).
split
()
pred_toks
=
normalize_answer
(
a_pred
).
split
()
if
not
is_whitespace_splited
:
if
not
is_whitespace_splited
:
gold_toks
=
gold_toks
[
0
]
gold_toks
=
gold_toks
[
0
]
if
gold_toks
else
""
pred_toks
=
pred_toks
[
0
]
pred_toks
=
pred_toks
[
0
]
if
pred_toks
else
""
common
=
collections
.
Counter
(
gold_toks
)
&
collections
.
Counter
(
pred_toks
)
common
=
collections
.
Counter
(
gold_toks
)
&
collections
.
Counter
(
pred_toks
)
num_same
=
sum
(
common
.
values
())
num_same
=
sum
(
common
.
values
())
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录