Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
models
提交
a94d553d
M
models
项目概览
PaddlePaddle
/
models
大约 1 年 前同步成功
通知
222
Star
6828
Fork
2962
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
602
列表
看板
标记
里程碑
合并请求
255
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
M
models
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
602
Issue
602
列表
看板
标记
里程碑
合并请求
255
合并请求
255
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
a94d553d
编写于
5月 23, 2017
作者:
L
LiuYongFeng
提交者:
GitHub
5月 23, 2017
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update README.md
上级
76f933ef
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
15 addition
and
0 deletion
+15
-0
README.md
README.md
+15
-0
未找到文件。
README.md
浏览文件 @
a94d553d
...
...
@@ -2,49 +2,64 @@
# models简介
## 词向量
-
**介绍:**
狭义上讲,词向量是指把所有文本样本中的每个单词映射到一个向量。比如,对于文本“A B A E B F G”,我们最终得到单词A对应的向量为[0.1 0.6 -0.5],单词B对应的向量为[-0.2 0.9 0.7] 。相对于one-hot表示方式,词向量方式更容易计算单词之间的相似性,表示方式更加紧凑。
广义上讲,词向量也可以应用于普通离散特征,可以充分利用无监督数据,充分捕获特征间的关系,可以有效解决特征稀疏、标签数据缺失、数据噪声等问题。
-
**应用领域:**
词向量是自然语言处理中常见的一个操作,是搜索引擎、广告系统、推荐系统等互联网服务背后常见的基础技术。
-
**模型配置说明:**
[word_embedding](https://github.com/PaddlePaddle/models/tree/develop/word_embedding) |
## 文本生成
-
**介绍:**
文本生成(Sequence to Sequence),是一种时序对映射的过程,实现了深度学习模型在序列问题中的应用,其中比较突出的是机器翻译和机器人问答。
-
**应用领域:**
文本生成模型可扩展应用于:机器翻译、智能对话与问答、广告创意语料生成、自动编码(如金融画像编码)等业务领域
-
**模型配置说明:**
[
sequence_tagging_for_ner
](
https://github.com/PaddlePaddle/models/tree/develop/sequence_tagging_for_ner
)
|
[
seq2seq
](
https://github.com/PaddlePaddle/models/tree/develop/seq2seq
)
## LTR
-
**介绍:**
LTR(learning to rank)是用于解决排序问题的监督学习算法。LTR可分为以下三种:
- Pointwis:将排序问题转化为多类分类问题或者回归问题。对于检索问题,只考虑给定查询下,单个文档的绝对相关度。
- PairWise:排序问题被转化成结果对的 回归 、 分类 或 有序分类 的问题。考虑给定查询下,两个文档之间的相对相关度。
- ListWise:不再将Ranking问题直接形式化为一个分类或者回归问题,考虑给定查询下的文档集合的整体序列。
PaddlePaddle提供的模型是ListWise的一种实现LambdaRank。
-
**应用领域:**
LTR最标准的应用场景是搜索排序,包括:图片搜索排序、外卖美食搜索排序、App搜索排序、酒店搜索排序。同时,还可以扩展应用于:关键词推荐排序、各类业务榜单排序、个性化推荐排序等。
-
**模型配置说明:**
[LTR](https://github.com/PaddlePaddle/models/tree/develop/ltr) |
## 文本分类
-
**介绍:**
通过深度神经网络模型对文本样本进行分类,支持二分类和多分类。模型包含word embedding步骤,用户可直接将原始文本数据作为输入。
-
**应用领域:**
文本分类可扩展用于以下业务领域:文章质量评估,色情暴力文章识别,评论情绪识别,广告物料风险控制等。
-
**模型配置说明:**
[text_classification](https://github.com/PaddlePaddle/models/tree/develop/text_classification) |
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录