Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleHub
提交
b8dbff98
P
PaddleHub
项目概览
PaddlePaddle
/
PaddleHub
大约 1 年 前同步成功
通知
282
Star
12117
Fork
2091
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
200
列表
看板
标记
里程碑
合并请求
4
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleHub
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
200
Issue
200
列表
看板
标记
里程碑
合并请求
4
合并请求
4
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
b8dbff98
编写于
5月 26, 2020
作者:
S
Steffy-zxf
提交者:
GitHub
5月 26, 2020
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update docs (#619)
* update docs
上级
acfa4e4f
变更
5
隐藏空白更改
内联
并排
Showing
5 changed file
with
12 addition
and
11 deletion
+12
-11
RELEASE.md
RELEASE.md
+2
-2
demo/text_classification/README.md
demo/text_classification/README.md
+1
-0
docs/reference/task/text_classify_task.md
docs/reference/task/text_classify_task.md
+1
-1
docs/release.md
docs/release.md
+2
-2
paddlehub/network/classification.py
paddlehub/network/classification.py
+6
-6
未找到文件。
RELEASE.md
浏览文件 @
b8dbff98
...
...
@@ -5,9 +5,9 @@
*
新增工业级短视频分类模型
[
videotag_tsn_lstm
](
https://paddlepaddle.org.cn/hubdetail?name=videotag_tsn_lstm&en_category=VideoClassification
)
,支持3000类中文标签识别
*
新增轻量级中文OCR模型
[
chinese_ocr_db_rcnn
](
https://www.paddlepaddle.org.cn/hubdetail?name=chinese_ocr_db_rcnn&en_category=TextRecognition
)
、
[
chinese_text_detection_db
](
https://www.paddlepaddle.org.cn/hubdetail?name=chinese_text_detection_db&en_category=TextRecognition
)
,支持一键快速OCR识别
*
新增行人检测、车辆检测、动物识别、Object等工业级模型
*
Fine-tune API升级
*
文本分类任务新增6个预置网络,包括CNN, BOW, LSTM, BiLSTM, DPCNN等
*
文本分类任务新增6个预置网络,包括CNN, BOW, LSTM, BiLSTM, DPCNN等
*
使用VisualDL可视化训练评估性能数据
## `v1.6.2`
...
...
demo/text_classification/README.md
浏览文件 @
b8dbff98
...
...
@@ -195,6 +195,7 @@ cls_task.finetune_and_eval()
如果不使用预置网络,直接通过fc网络进行分类,则应取Transformer类预训练模型的pooled_output特征(
`outputs["pooled_output"]`
)。并且
`hub.TextClassifierTask(feature=outputs["pooled_output"])`
。
5.
使用预置网络,可以通过
`hub.TextClassifierTask`
参数network进行指定不同的网络结构。如下代码表示选择bilstm网络拼接在Transformer类预训练模型之后。
PaddleHub文本分类任务预置网络支持BOW,Bi-LSTM,CNN,DPCNN,GRU,LSTM。指定network应是其中之一。
其中DPCNN网络实现为
[
ACL2017-Deep Pyramid Convolutional Neural Networks for Text Categorization
](
https://www.aclweb.org/anthology/P17-1052.pdf
)
。
```
python
cls_task
=
hub
.
TextClassifierTask
(
data_reader
=
reader
,
...
...
docs/reference/task/text_classify_task.md
浏览文件 @
b8dbff98
...
...
@@ -21,7 +21,7 @@ hub.TextClassifierTask(
*
data_reader: 提供数据的Reader,可选为ClassifyReader和LACClassifyReader。
*
feature(fluid.Variable): 输入的sentence-level特征矩阵,shape应为[-1, emb_size]。默认为None。
*
token_feature(fluid.Variable): 输入的token-level特征矩阵,shape应为[-1, seq_len, emb_size]。默认为None。feature和token_feature须指定其中一个。
*
network(str): 文本分类任务PaddleHub预置网络,支持BOW,Bi-LSTM,CNN,DPCNN,GRU,LSTM。如果指定network,则应使用token_feature作为输入特征。
*
network(str): 文本分类任务PaddleHub预置网络,支持BOW,Bi-LSTM,CNN,DPCNN,GRU,LSTM。如果指定network,则应使用token_feature作为输入特征。
其中DPCNN网络实现为
[
ACL2017-Deep Pyramid Convolutional Neural Networks for Text Categorization
](
https://www.aclweb.org/anthology/P17-1052.pdf
)
。
*
startup_program (fluid.Program): 存储了模型参数初始化op的Program,如果未提供,则使用fluid.default_startup_program()
*
config (
[
RunConfig
](
../config.md
)
): 运行配置,如设置batch_size,epoch,learning_rate等。
*
hidden_units (list): TextClassifierTask最终的全连接层输出维度为label_size,是每个label的概率值。在这个全连接层之前可以设置额外的全连接层,并指定它们的输出维度,例如hidden_units=[4,2]表示先经过一层输出维度为4的全连接层,再输入一层输出维度为2的全连接层,最后再输入输出维度为label_size的全连接层。
...
...
docs/release.md
浏览文件 @
b8dbff98
...
...
@@ -7,9 +7,9 @@
*
新增工业级短视频分类模型
[
videotag_tsn_lstm
](
https://paddlepaddle.org.cn/hubdetail?name=videotag_tsn_lstm&en_category=VideoClassification
)
,支持3000类中文标签识别
*
新增轻量级中文OCR模型
[
chinese_ocr_db_rcnn
](
https://www.paddlepaddle.org.cn/hubdetail?name=chinese_ocr_db_rcnn&en_category=TextRecognition
)
、
[
chinese_text_detection_db
](
https://www.paddlepaddle.org.cn/hubdetail?name=chinese_text_detection_db&en_category=TextRecognition
)
,支持一键快速OCR识别
*
新增行人检测、车辆检测、动物识别、Object等工业级模型
*
Fine-tune API升级
*
文本分类任务新增6个预置网络,包括CNN, BOW, LSTM, BiLSTM, DPCNN等
*
文本分类任务新增6个预置网络,包括CNN, BOW, LSTM, BiLSTM, DPCNN等
*
使用VisualDL可视化训练评估性能数据
## `v1.6.2`
...
...
paddlehub/network/classification.py
浏览文件 @
b8dbff98
...
...
@@ -22,7 +22,7 @@ import paddle.fluid as fluid
def
bilstm
(
token_embeddings
,
hid_dim
=
128
,
hid_dim2
=
96
):
"""
bilstm net
BiLSTM network.
"""
fc0
=
fluid
.
layers
.
fc
(
input
=
token_embeddings
,
size
=
hid_dim
*
4
)
rfc0
=
fluid
.
layers
.
fc
(
input
=
token_embeddings
,
size
=
hid_dim
*
4
)
...
...
@@ -44,7 +44,7 @@ def bilstm(token_embeddings, hid_dim=128, hid_dim2=96):
def
bow
(
token_embeddings
,
hid_dim
=
128
,
hid_dim2
=
96
):
"""
bow net
BOW network.
"""
# bow layer
bow
=
fluid
.
layers
.
sequence_pool
(
input
=
token_embeddings
,
pool_type
=
'sum'
)
...
...
@@ -57,7 +57,7 @@ def bow(token_embeddings, hid_dim=128, hid_dim2=96):
def
cnn
(
token_embeddings
,
hid_dim
=
128
,
win_size
=
3
):
"""
cnn net
CNN network.
"""
# cnn layer
conv
=
fluid
.
nets
.
sequence_conv_pool
(
...
...
@@ -77,7 +77,7 @@ def dpcnn(token_embeddings,
emb_dim
=
1024
,
blocks
=
6
):
"""
deepcnn net
implemented as ACL2017 'Deep Pyramid Convolutional Neural Networks for Text Categorization'
Deep Pyramid Convolutional Neural Networks is
implemented as ACL2017 'Deep Pyramid Convolutional Neural Networks for Text Categorization'
For more information, please refer to https://www.aclweb.org/anthology/P17-1052.pdf.
"""
...
...
@@ -111,7 +111,7 @@ def dpcnn(token_embeddings,
def
gru
(
token_embeddings
,
hid_dim
=
128
,
hid_dim2
=
96
):
"""
gru net
GRU network.
"""
fc0
=
fluid
.
layers
.
fc
(
input
=
token_embeddings
,
size
=
hid_dim
*
3
)
gru_h
=
fluid
.
layers
.
dynamic_gru
(
input
=
fc0
,
size
=
hid_dim
,
is_reverse
=
False
)
...
...
@@ -123,7 +123,7 @@ def gru(token_embeddings, hid_dim=128, hid_dim2=96):
def
lstm
(
token_embeddings
,
hid_dim
=
128
,
hid_dim2
=
96
):
"""
lstm net
LSTM network.
"""
# lstm layer
fc0
=
fluid
.
layers
.
fc
(
input
=
token_embeddings
,
size
=
hid_dim
*
4
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录