From 3ec74b01fabeb4303aa1783190341b9218dc8d5e Mon Sep 17 00:00:00 2001 From: Qiao Longfei Date: Tue, 30 Oct 2018 17:29:46 +0800 Subject: [PATCH] follow comment --- doc/fluid/user_guides/howto/training/cluster_howto.rst | 7 ++++++- 1 file changed, 6 insertions(+), 1 deletion(-) diff --git a/doc/fluid/user_guides/howto/training/cluster_howto.rst b/doc/fluid/user_guides/howto/training/cluster_howto.rst index 8ab0e0c2f..ceb2b9cfe 100644 --- a/doc/fluid/user_guides/howto/training/cluster_howto.rst +++ b/doc/fluid/user_guides/howto/training/cluster_howto.rst @@ -123,13 +123,18 @@ Fluid支持千亿量级超大规模稀疏特征embedding的训练,embedding参 需要配合稀疏更新一起使用。 使用方法,在配置embedding的时候,加上参数 :code:`is_distributed=True` 以及 :code:`is_sparse=True` 即可。 +参数 :code:`dict_size` 定义数据中总的id的数量,id可以是int64范围内的任意值,只要总id个数小于等于dict_size就可以支持。 +所以配置之前需要预估一下数据中总的feature id的数量。 + +TODO: +1. 支持embedding表自动增长,去掉对dict_size的依赖。 .. code-block:: python emb = fluid.layers.embedding( is_distributed=True, input=input, - size=[10000000000, 9], + size=[dict_size, embedding_width], is_sparse=True) -- GitLab