Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
DeepSpeech
提交
f852514a
D
DeepSpeech
项目概览
PaddlePaddle
/
DeepSpeech
大约 2 年 前同步成功
通知
210
Star
8425
Fork
1598
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
245
列表
看板
标记
里程碑
合并请求
3
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
DeepSpeech
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
245
Issue
245
列表
看板
标记
里程碑
合并请求
3
合并请求
3
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
f852514a
编写于
5月 25, 2022
作者:
Y
Yang Zhou
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
mv text_to_lexicon.py to utils
上级
c76c4800
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
38 addition
and
1 deletion
+38
-1
speechx/examples/ds2_ol/aishell/run_build_tlg.sh
speechx/examples/ds2_ol/aishell/run_build_tlg.sh
+1
-1
utils/text_to_lexicon.py
utils/text_to_lexicon.py
+37
-0
未找到文件。
speechx/examples/ds2_ol/aishell/run_build_tlg.sh
浏览文件 @
f852514a
...
@@ -55,7 +55,7 @@ if [ ${stage} -le 0 ] && [ ${stop_stage} -ge 0 ]; then
...
@@ -55,7 +55,7 @@ if [ ${stage} -le 0 ] && [ ${stop_stage} -ge 0 ]; then
cp
$unit
data/local/dict/units.txt
cp
$unit
data/local/dict/units.txt
if
[
!
-f
$lexicon
]
;
then
if
[
!
-f
$lexicon
]
;
then
local
/text_to_lexicon.py
--has_key
true
--text
$text
--lexicon
$lexicon
utils
/text_to_lexicon.py
--has_key
true
--text
$text
--lexicon
$lexicon
echo
"Generate
$lexicon
from
$text
"
echo
"Generate
$lexicon
from
$text
"
fi
fi
...
...
utils/text_to_lexicon.py
0 → 100755
浏览文件 @
f852514a
#!/usr/bin/env python3
import
argparse
from
collections
import
Counter
def
main
(
args
):
counter
=
Counter
()
with
open
(
args
.
text
,
'r'
)
as
fin
,
open
(
args
.
lexicon
,
'w'
)
as
fout
:
for
line
in
fin
:
line
=
line
.
strip
()
if
args
.
has_key
:
utt
,
text
=
line
.
split
(
maxsplit
=
1
)
words
=
text
.
split
()
else
:
words
=
line
.
split
()
counter
.
update
(
words
)
for
word
in
counter
:
val
=
" "
.
join
(
list
(
word
))
fout
.
write
(
f
"
{
word
}
\t
{
val
}
\n
"
)
fout
.
flush
()
if
__name__
==
'__main__'
:
parser
=
argparse
.
ArgumentParser
(
description
=
'text(line:utt1 中国 人) to lexicon(line:中国 中 国).'
)
parser
.
add_argument
(
'--has_key'
,
default
=
True
,
help
=
'text path, with utt or not'
)
parser
.
add_argument
(
'--text'
,
required
=
True
,
help
=
'text path. line: utt1 中国 人 or 中国 人'
)
parser
.
add_argument
(
'--lexicon'
,
required
=
True
,
help
=
'lexicon path. line:中国 中 国'
)
args
=
parser
.
parse_args
()
print
(
args
)
main
(
args
)
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录