Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
fecde703
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 1 年 前同步成功
通知
206
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
fecde703
编写于
9月 07, 2022
作者:
W
WongLaw
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Revised the Chinese doc, test=doc
上级
1459162a
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
11 addition
and
11 deletion
+11
-11
demos/metaverse/README_cn.md
demos/metaverse/README_cn.md
+5
-5
demos/story_talker/README_cn.md
demos/story_talker/README_cn.md
+1
-1
demos/style_fs2/README_cn.md
demos/style_fs2/README_cn.md
+5
-5
未找到文件。
demos/metaverse/README_cn.md
浏览文件 @
fecde703
...
...
@@ -4,13 +4,13 @@
## 简介
Metaverse是一种新的互联网应用和社交形式,融合了多种新技术,产生了虚拟现实。
Metaverse
是一种新的互联网应用和社交形式,融合了多种新技术,产生了虚拟现实。
这个演示是一个让图片中的名人“说话”的实现。通过
`PaddleSpeech`
和
`PaddleGAN`
的
`TTS`
模块的组合,我们集成了安装和特定模块到一个shell
脚本中。
这个演示是一个让图片中的名人“说话”的实现。通过
`PaddleSpeech`
和
`PaddleGAN`
的
`TTS`
模块的组合,我们集成了安装和特定模块到一个 shell
脚本中。
## 使用
您可以使用
`PaddleSpeech`
和
`PaddleGAN`
的
`TTS`
模块让您最喜欢的人说出指定的内容,并构建您的虚拟人。
您可以使用
`PaddleSpeech`
和
`PaddleGAN`
的
`TTS`
模块让您最喜欢的人说出指定的内容,并构建您的虚拟人。
运行
`run.sh`
完成所有基本程序,包括安装。
...
...
@@ -20,8 +20,8 @@ Metaverse是一种新的互联网应用和社交形式,融合了多种新技
在
`run.sh`
, 先会执行
`source path.sh`
来设置好环境变量。
如果您想尝试您的句子,请替换
`sentences.txt`
中的句子。
如果您想尝试您的句子,请替换
`sentences.txt`
中的句子。
如果您想尝试图像,请将图像替换
shell脚本中的
`download/Lamarr.png`
。
如果您想尝试图像,请将图像替换
shell 脚本中的
`download/Lamarr.png`
。
结果已显示在我们的
[
notebook
](
https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/tutorial/tts/tts_tutorial.ipynb
)
。
demos/story_talker/README_cn.md
浏览文件 @
fecde703
...
...
@@ -7,7 +7,7 @@
故事书是非常重要的儿童启蒙书,但家长通常没有足够的时间为孩子读故事书。对于非常小的孩子,他们可能不理解故事书中的汉字。或有时,孩子们只是想“听”,而不想“读”。
您可以使用
`PaddleOCR`
获取故事书的文本,并通过
`PaddleSpeech`
的
`TTS`
模块进行阅读。
您可以使用
`PaddleOCR`
获取故事书的文本,并通过
`PaddleSpeech`
的
`TTS`
模块进行阅读。
## 使用
...
...
demos/style_fs2/README_cn.md
浏览文件 @
fecde703
...
...
@@ -4,17 +4,17 @@
## 简介
[
FastSpeech2
](
https://arxiv.org/abs/2006.04558
)
是用于语音合成的经典声学模型,它引入了可控语音输入,包括
`phoneme duration`
、
`energy`
和
`pitch`
。
[
FastSpeech2
](
https://arxiv.org/abs/2006.04558
)
是用于语音合成的经典声学模型,它引入了可控语音输入,包括
`phoneme duration`
、
`energy`
和
`pitch`
。
在预测阶段,您可以更改这些变量以获得一些有趣的结果。
例如:
1.
`FastSpeech2`
中的
`duration`
可以控制音频的速度 ,并保持
`pitch`
。(在某些语音工具中,增加速度将增加音调,反之亦然。)
2.
当我们将一个句子的
`pitch`
设置为平均值并将音素的
`tones`
设置为
`1`
时,我们将获得
`robot-style`
的音色。
3.
当我们提高成年女性的
`pitch`
(比例固定)时,我们会得到
`child-style`
的音色。
1.
`FastSpeech2`
中的
`duration`
可以控制音频的速度 ,并保持
`pitch`
。(在某些语音工具中,增加速度将增加音调,反之亦然。)
2.
当我们将一个句子的
`pitch`
设置为平均值并将音素的
`tones`
设置为
`1`
时,我们将获得
`robot-style`
的音色。
3.
当我们提高成年女性的
`pitch`
(比例固定)时,我们会得到
`child-style`
的音色。
句子中不同音素的
`duration`
和
`pitch`
可以具有不同的比例。您可以设置不同的音阶比例来强调或削弱某些音素的发音。
句子中不同音素的
`duration`
和
`pitch`
可以具有不同的比例。您可以设置不同的音阶比例来强调或削弱某些音素的发音。
## 运行
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录