Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
甜加冰6654
NewsRecommendSystem
提交
e037e461
N
NewsRecommendSystem
项目概览
甜加冰6654
/
NewsRecommendSystem
与 Fork 源项目一致
从无法访问的项目Fork
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
N
NewsRecommendSystem
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
e037e461
编写于
3月 02, 2018
作者:
T
Tom Qian
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
sth new
sth new
上级
e2ac8a52
变更
12
展开全部
隐藏空白更改
内联
并排
Showing
12 changed file
with
21 addition
and
19 deletion
+21
-19
README.md
README.md
+3
-3
res/dbconfig.properties
res/dbconfig.properties
+3
-3
src/top/qianxinyao/Main/TestDataRunner.java
src/top/qianxinyao/Main/TestDataRunner.java
+1
-1
src/top/qianxinyao/algorithms/JsonKit.java
src/top/qianxinyao/algorithms/JsonKit.java
+2
-2
src/top/qianxinyao/algorithms/RecommendKit.java
src/top/qianxinyao/algorithms/RecommendKit.java
+1
-1
src/top/qianxinyao/contentbasedrecommend/UserPrefRefresher.java
...p/qianxinyao/contentbasedrecommend/UserPrefRefresher.java
+1
-1
target/classes/top/qianxinyao/Main/TestDataRunner.class
target/classes/top/qianxinyao/Main/TestDataRunner.class
+0
-0
target/classes/top/qianxinyao/algorithms/JsonKit$3.class
target/classes/top/qianxinyao/algorithms/JsonKit$3.class
+0
-0
target/classes/top/qianxinyao/algorithms/JsonKit.class
target/classes/top/qianxinyao/algorithms/JsonKit.class
+0
-0
target/classes/top/qianxinyao/algorithms/RecommendKit.class
target/classes/top/qianxinyao/algorithms/RecommendKit.class
+0
-0
target/classes/top/qianxinyao/contentbasedrecommend/UserPrefRefresher.class
.../qianxinyao/contentbasedrecommend/UserPrefRefresher.class
+0
-0
test_data.sql
test_data.sql
+10
-8
未找到文件。
README.md
浏览文件 @
e037e461
...
...
@@ -178,7 +178,7 @@ public class Main
测试数据中包含以下几个部分:
-
users表:7个测试用户
-
news表:30
7
个2017-12-12日从网易首页抓取的测试新闻
-
news表:30
6
个2017-12-12日从网易首页抓取的测试新闻
-
newsmodules表:17个测试模块
-
newslogs:测试推荐算法效果用的9条浏览记录
...
...
@@ -200,9 +200,9 @@ new TestDataRunner().runTestData();
1.
com.qianxinyao.TomNewsRecommender下的NewsScraper类是抓取网易的测试新闻时用的类,大家也可以用这个类继续采集新闻。该类默认对网易新闻首页的所有新闻进行一次抓取入库。
2.
协同过滤的效果目前不太稳定/可控,因为采用的是Mahout内置的协同过滤工具。一般来说,新闻模块的活跃用户越多,则协同过滤效果越好,也越明显。若有需求,我会在后期自己实现能稳定生成指定数量的推荐结果的协同过滤算法。
2.
协同过滤的效果目前不太稳定/可控,因为采用的是Mahout内置的协同过滤工具。一般来说,新闻模块的活跃用户越多,则协同过滤效果越好,也越明显。若有需求,我会在后期自己实现能稳定生成指定数量的推荐结果的协同过滤算法。
3.
一般当协同过滤与基于内容的推荐算法生成的推荐数目不足时,可以用基于热点新闻的推荐进行数量补充。
3.
一般当协同过滤与基于内容的推荐算法生成的推荐数目不足时,可以用基于热点新闻的推荐进行数量补充。
...
...
res/dbconfig.properties
浏览文件 @
e037e461
url
=
jdbc:mysql://121.42.36.199:3306/tom_recommender?useUnicode=true&characterEncoding=utf8
user
=
root
password
=
qxysay1+1=2
\ No newline at end of file
url
=
jdbc:mysql://[ip]/[database]?useUnicode=true&characterEncoding=utf8
user
=
password =
\ No newline at end of file
src/top/qianxinyao/Main/TestDataRunner.java
浏览文件 @
e037e461
...
...
@@ -20,7 +20,7 @@ public class TestDataRunner
System
.
out
.
println
(
"开始测试数据的运行!"
);
//选择要在推荐系统中运行的推荐算法
boolean
enableCF
=
false
,
enableCB
=
false
,
enableHR
=
tru
e
;
boolean
enableCF
=
false
,
enableCB
=
true
,
enableHR
=
fals
e
;
JobSetter
jobSetter
=
new
JobSetter
(
enableCF
,
enableCB
,
enableHR
);
...
...
src/top/qianxinyao/algorithms/JsonKit.java
浏览文件 @
e037e461
...
...
@@ -123,12 +123,12 @@ public class JsonKit
ObjectMapper
objectMapper
=
new
ObjectMapper
();
CustomizedHashMap
<
Integer
,
CustomizedHashMap
<
String
,
Double
>>
map
=
null
;
try
{
{
System
.
out
.
println
(
"srcJson:"
+
srcJson
);
map
=
objectMapper
.
readValue
(
srcJson
,
new
TypeReference
<
CustomizedHashMap
<
Integer
,
CustomizedHashMap
<
String
,
Double
>>>(){});
}
catch
(
JsonParseException
e
)
{
// TODO Auto-generated catch block
e
.
printStackTrace
();
}
catch
(
JsonMappingException
e
)
...
...
src/top/qianxinyao/algorithms/RecommendKit.java
浏览文件 @
e037e461
...
...
@@ -73,7 +73,7 @@ public class RecommendKit
String
newsids
=
getInQueryString
(
col
.
iterator
());
if
(!
newsids
.
equals
(
"()"
))
{
List
<
News
>
newsList
=
News
.
dao
.
find
(
"select
news_
id,news_time from news where id in "
+
newsids
);
List
<
News
>
newsList
=
News
.
dao
.
find
(
"select id,news_time from news where id in "
+
newsids
);
for
(
News
news:
newsList
)
{
if
(
news
.
getNewsTime
().
before
(
getInRecTimestamp
(
beforeDays
)))
...
...
src/top/qianxinyao/contentbasedrecommend/UserPrefRefresher.java
浏览文件 @
e037e461
...
...
@@ -214,7 +214,7 @@ public class UserPrefRefresher
if
(
newsIdListQuery
.
length
()>
1
){
newsIdListQuery
=
newsIdListQuery
.
substring
(
0
,
newsIdListQuery
.
length
()-
1
)+
")"
;
//提取出所有新闻的关键词列表及对应TF-IDf值,并放入一个map中
List
<
News
>
newsList
=
News
.
dao
.
find
(
"select id,title,content,module_id from news where
news
id in "
+
newsIdListQuery
);
List
<
News
>
newsList
=
News
.
dao
.
find
(
"select id,title,content,module_id from news where id in "
+
newsIdListQuery
);
newsTFIDFMap
=
new
HashMap
<
String
,
Object
>();
for
(
News
news:
newsList
){
...
...
target/classes/top/qianxinyao/Main/TestDataRunner.class
浏览文件 @
e037e461
无法预览此类型文件
target/classes/top/qianxinyao/algorithms/JsonKit$3.class
浏览文件 @
e037e461
无法预览此类型文件
target/classes/top/qianxinyao/algorithms/JsonKit.class
浏览文件 @
e037e461
无法预览此类型文件
target/classes/top/qianxinyao/algorithms/RecommendKit.class
浏览文件 @
e037e461
无法预览此类型文件
target/classes/top/qianxinyao/contentbasedrecommend/UserPrefRefresher.class
浏览文件 @
e037e461
无法预览此类型文件
test_data.sql
100755 → 100644
浏览文件 @
e037e461
此差异已折叠。
点击以展开。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录