提交 aac292ae 编写于 作者: W wizardforcel

2020-08-06 18:38:43

上级 bce6e004
......@@ -406,25 +406,25 @@ MLP 在 1986 年首次使用反向传播训练算法成功训练。然而,现
| ID | 属性 | 说明 |
| --- | --- | --- |
| 1 | `age` | 年龄数字。 |
| 2 | `job` | 这是具有可能值的分类格式的职业类型`admin``blue-collar``entrepreneur``housemaid``management``retired``self-employed``services``student``technician``unemployed``unknown`。 |
| 3 | `marital` | 这是具有可能值的分类格式的婚姻状态`divorced`(或`widowed`),`married``single``unknown`。 |
| 4 | `education` | 这是具有如下可能值的分类格式的教育背景`basic.4y``basic.6y``basic.9y``high.school``illiterate``professional.course``university.degree``unknown`。 |
| 五 | `default` | 这是一种分类格式,默认情况下可能包含信用值`no``yes``unknown`。 |
| 2 | `job` | 这是类别格式的职业类型,具有可能的值`admin``blue-collar``entrepreneur``housemaid``management``retired``self-employed``services``student``technician``unemployed``unknown`。 |
| 3 | `marital` | 这是类别格式的婚姻状态,具有可能的值`divorced`(或`widowed`),`married``single``unknown`。 |
| 4 | `education` | 这是类别格式的教育背景,具有如下可能的值`basic.4y``basic.6y``basic.9y``high.school``illiterate``professional.course``university.degree``unknown`。 |
| 五 | `default` | 这是类别格式的信用,默认情况下可能包含`no``yes``unknown`。 |
| 6 | `housing` | 客户是否有住房贷款? |
| 7 | `loan` | 具有可能值的分类格式的个人贷款`no``yes``unknown`。 |
| 8 | `contact` | 这是具有可能值的分类格式的通信类型`cellular``telephone`。 |
| 9 | `month` | 这是具有可能值的分类格式的一年中最后一个通话月份`jan``feb``mar`,... `nov``dec`。 |
| 10 | `day_of_week` | 这是一周中的最后一个通话日,其分类格式为可能的值:`mon``tue``wed``thu``fri`。 |
| 7 | `loan` | 类别格式的个人贷款,具有可能的值`no``yes``unknown`。 |
| 8 | `contact` | 这是类别格式的通信类型,具有可能的值`cellular``telephone`。 |
| 9 | `month` | 这是类别格式的一年中最后一个通话月份,具有可能的值`jan``feb``mar`,... `nov``dec`。 |
| 10 | `day_of_week` | 这是类别格式的一周中的最后一个通话日,具有可能的值:`mon``tue``wed``thu``fri`。 |
| 11 | `duration` | 这是以秒为单位的最后一次通话持续时间(数值)。此属性高度影响输出目标(例如,如果`duration = 0`,则`y = no`)。然而,在执行呼叫之前不知道持续时间。另外,在通话结束后,`y`显然是已知的。因此,此输入仅应包括在基准目的中,如果打算采用现实的预测模型,则应将其丢弃。 |
| 12 | `campaign` | 这是活动期间此客户的通话数量。 |
| 13 | `pdays` | 这是上一个广告系列和客户的上次通话之后经过的天数(数字 -999 表示之前未联系过客户)。 |
| 14 | `previous` | 这是之前此广告系列和此客户的通话数量(数字)。 |
| 15 | `poutcome` | 上一次营销活动的结果(分类`failure``nonexistent``success`)。 |
| 16 | `emp.var.rate` | 这是就业变化率季度指标(数字)。 |
| 17 | `cons.price.idx` | 这是消费者价格指数月度指标(数字)。 |
| 18 | `cons.conf.idx` | 这是消费者信心指数月度指标(数字)。 |
| 19 | `euribor3m` | 这是 3 个月的 euribor 费率每日指标(数字)。 |
| 20 | `nr.employed` | 这是员工数季度指标(数字)。 |
| 15 | `poutcome` | 上一次营销活动的结果(类别`failure``nonexistent``success`)。 |
| 16 | `emp.var.rate` | 这是就业变化率季度指标(数字)。 |
| 17 | `cons.price.idx` | 这是消费者价格指数月度指标(数字)。 |
| 18 | `cons.conf.idx` | 这是消费者信心指数月度指标(数字)。 |
| 19 | `euribor3m` | 这是 3 个月的 euribor 费率每日指标(数字)。 |
| 20 | `nr.employed` | 这是员工数季度指标(数字)。 |
| 21 | `y` | 表示客户是否拥有定期存款,可能值是二元:`yes``no`。 |
### 预处理
......
......@@ -810,9 +810,9 @@ plot_error()
UMICH SI650 - 情感分类数据集(删除了重复)包含有关密歇根大学捐赠的产品和电影评论的数据,可以从[此链接下载](https://inclass.kaggle.com/c/si650winter11/data/)。在获取令牌之前,已经清除了不需要的或特殊的字符(参见`data.csv`文件)。
以下脚本还会删除停用词(请参阅`data_preparation.py`)。给出一些标记为阴性或阳性的样本(1 为阳性,0 为阴性):
以下脚本还会删除停用词(请参阅`data_preparation.py`)。给出一些标记为阴性或阳性的样本(1 为正面,0 为负面):
| 情感 | SentimentText |
| 情感 | 情感文本 |
| --- | --- |
| 1 | 达芬奇密码书真棒。 |
| 1 | 我很喜欢达芬奇密码。 |
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册