Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
a9f91884
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 1 年 前同步成功
通知
206
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
未验证
提交
a9f91884
编写于
9月 29, 2022
作者:
Y
YangZhou
提交者:
GitHub
9月 29, 2022
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
fix punc in readme
上级
382503fc
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
3 addition
and
3 deletion
+3
-3
examples/tess/README.md
examples/tess/README.md
+3
-3
未找到文件。
examples/tess/README.md
浏览文件 @
a9f91884
# 背景
# 背景
TESS音频情绪分类任务
.
TESS音频情绪分类任务
。
从而校验和测试 paddle.audio 的feature, backend等相关模块
.
从而校验和测试 paddle.audio 的feature, backend等相关模块
。
本实验采用了PaddleSpeech提供了PANNs的CNN14的预训练模型进行finetune:
本实验采用了PaddleSpeech提供了PANNs的CNN14的预训练模型进行finetune:
-
CNN14: 该模型主要包含12个卷积层和2个全连接层,模型参数的数量为 79.6M,embbedding维度是 2048。
-
CNN14: 该模型主要包含12个卷积层和2个全连接层,模型参数的数量为 79.6M,embbedding维度是 2048。
...
@@ -10,7 +10,7 @@ TESS音频情绪分类任务.
...
@@ -10,7 +10,7 @@ TESS音频情绪分类任务.
## 数据集
## 数据集
[
TESS: Toronto emotional speech set
](
https://tspace.library.utoronto.ca/handle/1807/24487
)
是一个包含有 200 个目标词的时长为 2 ~ 3 秒的音频,七种情绪的数据集。由两个女演员录制(24岁和64岁),其中情绪分别是愤怒,恶心,害怕,高兴,惊喜,伤心,平淡
.
[
TESS: Toronto emotional speech set
](
https://tspace.library.utoronto.ca/handle/1807/24487
)
是一个包含有 200 个目标词的时长为 2 ~ 3 秒的音频,七种情绪的数据集。由两个女演员录制(24岁和64岁),其中情绪分别是愤怒,恶心,害怕,高兴,惊喜,伤心,平淡
。
## 模型指标
## 模型指标
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录