From c4cb00ee5590bb5b210d8a5b2719ab84ded2b05d Mon Sep 17 00:00:00 2001 From: windy444 <33304501+windy444@users.noreply.github.com> Date: Wed, 24 Jan 2018 17:40:12 +0800 Subject: [PATCH] =?UTF-8?q?=E4=BF=AE=E6=94=B9=E9=83=A8=E5=88=86=E6=8E=AA?= =?UTF-8?q?=E8=BE=9E?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- youtube_recall/README.cn.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/youtube_recall/README.cn.md b/youtube_recall/README.cn.md index 19e17f8a..4c575ac2 100644 --- a/youtube_recall/README.cn.md +++ b/youtube_recall/README.cn.md @@ -20,7 +20,7 @@ ## 背景介绍\[[1](#参考文献)\] Youtube是世界最大的视频网站之一, 其推荐系统帮助10亿以上的用户,从海量视频中,发现个性化的内容。该推荐系统主要面临以下三个挑战: - 规模: 许多现有的推荐算法证明在小数据量下运行良好,但不能满足YouTube这样庞大的用户群和内容库的场景,因此需要高度专业化的分布式学习算法和高效的线上服务。 -- 新鲜度: YouTube内容库更新频率极高,每秒上传小时级别视频。系统应及时追踪新上传的视频和用户的实时的行为,并且模型在推荐新/旧视频上有良好平衡能力。 +- 新鲜度: YouTube内容库更新频率极高,每秒上传大量视频。系统应及时追踪新上传的视频和用户的实时行为,并且模型在推荐新/旧视频上有良好平衡能力。 - 噪音: 噪音来自于两方面,其一,用户历史行为稀疏,且有各种不可观测的外部因素,以及用户满意度不明确。其二,内容本身的数据是非结构化的。因此算法应更具有鲁棒性。 下图展示了整个推荐系统框图: -- GitLab