CSDN 技术社区 / content / 零基础学机器学习

41

3

1

代码
- 文件
- 提交
- 分支
- Tags
- 贡献者
- 分支图
- Diff
Issue 0
- 列表
- 看板
- 标记
- 里程碑
合并请求 0
DevOps
Wiki 0
- Wiki
分析
- 仓库
- DevOps
项目成员
Pages

切换分支/标签

book_code_b88b00f6ad14402ea66695d6809614da

data

零基础学机器学习

第07课 循环神经网络——鉴定留言及探索系外行星

7.4 用SimpleRNN鉴定评论文本

code_2.py
查找文件
普通视图历史永久链接Permalink

code_2.py

391 字节

Newer

Older

extract  code  success

ToTensor
已提交
12月 24, 2021

from keras.preprocessing.text import Tokenizer # 导入分词工具
X_train_lst = df_train["Review Text"].values # 将评论读入张量(训练集)
y_train = df_train["Rating"].values # 构建标签集
dictionary_size = 20000 # 设定词典的大小
tokenizer = Tokenizer(num_words=dictionary_size) # 初始化词典
tokenizer.fit_on_texts( X_train_lst ) # 使用训练集创建词典索引