Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
models
提交
ae3af235
M
models
项目概览
PaddlePaddle
/
models
1 年多 前同步成功
通知
222
Star
6828
Fork
2962
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
602
列表
看板
标记
里程碑
合并请求
255
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
M
models
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
602
Issue
602
列表
看板
标记
里程碑
合并请求
255
合并请求
255
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
ae3af235
编写于
6月 14, 2017
作者:
Z
zhaopu
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update readme
上级
5f8bdf0b
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
20 addition
and
17 deletion
+20
-17
README.md
README.md
+20
-17
未找到文件。
README.md
浏览文件 @
ae3af235
...
...
@@ -14,54 +14,57 @@ PaddlePaddle提供了丰富的运算单元,帮助大家以模块化的方式
在词向量的例子中,我们向大家展示如何使用Hierarchical-Sigmoid 和噪声对比估计(Noise Contrastive Estimation,NCE)来加速词向量的学习。
-
1.1
[
Hsigmoid加速词向量训练
](
https://github.com/PaddlePaddle/models/tree/develop/word_embedding
)
-
1.2
[
噪声对比估计加速词向量训练
](
https://github.com/PaddlePaddle/models/tree/develop/nce_cost
)
## 2. 点击率预估
## 2. 语言模型
语言模型是自然语言处理领域里一个重要的基础模型,它是一个概率分布模型,利用它可以确定哪个词序列的可能性更大,或者给定若干个词,可以预测下一个最可能出现的词。语言模型被应用在很多领域,如:自动写作、QA、机器翻译、拼写检查、语音识别、词性标注等。
在语言模型的例子中,我们以文本生成为例,提供了RNN LM(包括LSTM、GRU)和N-Gram LM,供大家学习和使用。用户可以通过文档中的 “使用说明” 快速上手:适配训练语料,以训练 “自动写诗”、“自动写散文” 等有趣的模型。
-
2.1
[
基于LSTM、GRU、N-Gram的文本生成模型
](
https://github.com/PaddlePaddle/models/tree/develop/language_model
)
## 3. 点击率预估
点击率预估模型预判用户对一条广告点击的概率,对每次广告的点击情况做出预测,是广告技术的核心算法之一。逻谛斯克回归对大规模稀疏特征有着很好的学习能力,在点击率预估任务发展的早期一统天下。近年来,DNN 模型由于其强大的学习能力逐渐接过点击率预估任务的大旗。
在点击率预估的例子中,我们给出谷歌提出的 Wide & Deep 模型。这一模型融合了适用于学习抽象特征的 DNN 和适用于大规模稀疏特征的逻谛斯克回归两者模型的优点,可以作为一种相对成熟的模型框架使用, 在工业界也有一定的应用。
-
2
.1
[
Wide & deep 点击率预估模型
](
https://github.com/PaddlePaddle/models/tree/develop/ctr
)
-
3
.1
[
Wide & deep 点击率预估模型
](
https://github.com/PaddlePaddle/models/tree/develop/ctr
)
##
3
. 文本分类
##
4
. 文本分类
文本分类是自然语言处理领域最基础的任务之一,深度学习方法能够免除复杂的特征工程,直接使用原始文本作为输入,数据驱动地最优化分类准确率。
在文本分类的例子中,我们以情感分类任务为例,提供了基于DNN的非序列文本分类模型,以及基于CNN的序列模型供大家学习和使用(基于LSTM的模型见PaddleBook中
[
情感分类
](
https://github.com/PaddlePaddle/book/blob/develop/06.understand_sentiment/README.cn.md
)
一课)。
-
3
.1
[
基于 DNN / CNN 的情感分类
](
https://github.com/PaddlePaddle/models/tree/develop/text_classification
)
-
4
.1
[
基于 DNN / CNN 的情感分类
](
https://github.com/PaddlePaddle/models/tree/develop/text_classification
)
##
4
. 排序学习
##
5
. 排序学习
排序学习(Learning to Rank, LTR)是信息检索和搜索引擎研究的核心问题之一,通过机器学习方法学习一个分值函数对待排序的候选进行打分,再根据分值的高低确定序关系。深度神经网络可以用来建模分值函数,构成各类基于深度学习的LTR模型。
在排序学习的例子中,我们介绍基于 RankLoss 损失函数的 Pairwise 排序模型和基于LambdaRank损失函数的Listwise排序模型(Pointwise学习策略见PaddleBook中
[
推荐系统
](
https://github.com/PaddlePaddle/book/blob/develop/05.recommender_system/README.cn.md
)
一课)。
-
4
.1
[
基于 Pairwise 和 Listwise 的排序学习
](
https://github.com/PaddlePaddle/models/tree/develop/ltr
)
-
5
.1
[
基于 Pairwise 和 Listwise 的排序学习
](
https://github.com/PaddlePaddle/models/tree/develop/ltr
)
##
5
. 序列标注
##
6
. 序列标注
给定输入序列,序列标注模型为序列中每一个元素贴上一个类别标签,是自然语言处理领域最基础的任务之一。随着深度学习的不断探索和发展,利用循环神经网络学习输入序列的特征表示,条件随机场(Conditional Random Field, CRF)在特征基础上完成序列标注任务,逐渐成为解决序列标注问题的标配解决方案。
在序列标注的例子中,我们以命名实体识别(Named Entity Recognition,NER)任务为例,介绍如何训练一个端到端的序列标注模型。
-
5
.1
[
命名实体识别
](
https://github.com/PaddlePaddle/models/tree/develop/sequence_tagging_for_ner
)
-
6
.1
[
命名实体识别
](
https://github.com/PaddlePaddle/models/tree/develop/sequence_tagging_for_ner
)
##
6
. 序列到序列学习
##
7
. 序列到序列学习
序列到序列学习实现两个甚至是多个不定长模型之间的映射,有着广泛的应用,包括:机器翻译、智能对话与问答、广告创意语料生成、自动编码(如金融画像编码)、判断多个文本串之间的语义相关性等。
在序列到序列学习的例子中,我们以机器翻译任务为例,提供了多种改进模型,供大家学习和使用。包括:不带注意力机制的序列到序列映射模型,这一模型是所有序列到序列学习模型的基础;使用 scheduled sampling 改善 RNN 模型在生成任务中的错误累积问题;带外部记忆机制的神经机器翻译,通过增强神经网络的记忆能力,来完成复杂的序列到序列学习任务。
-
6.1
[
无注意力机制的编码器解码器模型
](
https://github.com/PaddlePaddle/models/tree/develop/nmt_without_attention
)
## 7. 语言模型
语言模型是自然语言处理领域里一个重要的基础模型,它是一个概率分布模型,利用它可以确定哪个词序列的可能性更大,或者给定若干个词,可以预测下一个最可能出现的词。语言模型被应用在很多领域,如:自动写作、QA、机器翻译、拼写检查、语音识别、词性标注等。
在语言模型的例子中,我们以文本生成为例,提供了RNN LM(包括LSTM、GRU)和N-Gram LM,供大家学习和使用。用户可以通过文档中的 “使用说明” 快速上手:适配训练语料,以训练 “自动写诗”、“自动写散文” 等有趣的模型。
-
7.1
[
无注意力机制的编码器解码器模型
](
https://github.com/PaddlePaddle/models/tree/develop/nmt_without_attention
)
-
7.1
[
基于LSTM、GRU、N-Gram的文本生成模型
](
https://github.com/PaddlePaddle/models/tree/develop/language_model
)
## Copyright and License
PaddlePaddle is provided under the
[
Apache-2.0 license
](
LICENSE
)
.
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录