From d58027829113fc5b4d2a83f779fcb1b785f079cd Mon Sep 17 00:00:00 2001 From: ranqiu Date: Tue, 31 Oct 2017 19:12:28 +0800 Subject: [PATCH] Refine doc of DSSM --- dssm/README.cn.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/dssm/README.cn.md b/dssm/README.cn.md index 06f0f51a..17f9a923 100644 --- a/dssm/README.cn.md +++ b/dssm/README.cn.md @@ -24,7 +24,7 @@ DSSM 已经发展成了一个框架,可以很自然地建模两个记录之间

其贯彻的思想是, **用DNN将高维特征向量转化为低纬空间的连续向量(图中红色框部分)** , -**在上层用cosin similarity来衡量用户搜索词与候选文档间的语义相关性** 。 +**在上层用cosine similarity来衡量用户搜索词与候选文档间的语义相关性** 。 在最顶层损失函数的设计上,原始模型使用类似Word2Vec中负例采样的方法, 一个Query会抽取正例 $D+$ 和4个负例 $D-$ 整体上算条件概率用对数似然函数作为损失, @@ -420,7 +420,7 @@ optional arguments: path of the target's word dic, if not set, the `source_dic_path` will be used -b BATCH_SIZE, --batch_size BATCH_SIZE - size of mini-batch (default:10) + size of mini-batch (default:32) -p NUM_PASSES, --num_passes NUM_PASSES number of passes to run(default:10) -y MODEL_TYPE, --model_type MODEL_TYPE -- GitLab