未验证 提交 c5d6602a 编写于 作者: S Shan Yi 提交者: GitHub

Update README.md

上级 bdc13f2f
...@@ -99,7 +99,7 @@ RNN是一个序列模型,基本思路是:在时刻$t$,将前一时刻$t-1$ ...@@ -99,7 +99,7 @@ RNN是一个序列模型,基本思路是:在时刻$t$,将前一时刻$t-1$
``` ```
1. `max_word_num`:指定字典中含有多少个词。 1. `max_word_num`:指定字典中含有多少个词。
2. `cutoff_word_fre`:字典中词语在训练语料中出现的最低频率。 2. `cutoff_word_fre`:字典中词语在训练语料中出现的最低频率。
- 加入指定了 `max_word_num = 5000`,并且 `cutoff_word_fre = 10`,词频统计发现训练语料中出现频率高于10次的词语仅有3000个,那么最终会取3000个词构成词典。 - 假如指定了 `max_word_num = 5000`,并且 `cutoff_word_fre = 10`,词频统计发现训练语料中出现频率高于10次的词语仅有3000个,那么最终会取3000个词构成词典。
- 构建词典时,会自动加入两个特殊符号: - 构建词典时,会自动加入两个特殊符号:
1. `<unk>`:不出现在字典中的词 1. `<unk>`:不出现在字典中的词
2. `<e>`:句子的结束符 2. `<e>`:句子的结束符
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册