From 79252c7fb86c9591fdbc3c6d26ee0259d37c5678 Mon Sep 17 00:00:00 2001 From: chengmo Date: Fri, 15 May 2020 17:45:12 +0800 Subject: [PATCH] update readne --- doc/custom_dataset_reader.md | 42 ++++++++++++++++++------------------ readme.md | 4 ++-- 2 files changed, 23 insertions(+), 23 deletions(-) diff --git a/doc/custom_dataset_reader.md b/doc/custom_dataset_reader.md index 2a630b23..b938ab0b 100644 --- a/doc/custom_dataset_reader.md +++ b/doc/custom_dataset_reader.md @@ -87,30 +87,30 @@ Reader的逻辑需要一个单独的python文件进行描述。我们试写一 3. 在`init(self)`函数中声明一些在数据读取中会用到的变量,必要时可以在`config.yaml`文件中配置变量,利用`env.get_global_env()`拿到。 -比如,我们希望从yaml文件中读取一个数据预处理变量`avg=10`,目的是将数据A的数据缩小10倍,可以这样实现: - -- 首先更改yaml文件,在某个space下加入该变量 - - ```yaml - ... - train: - reader: - avg: 10 - ... - ``` + 比如,我们希望从yaml文件中读取一个数据预处理变量`avg=10`,目的是将数据A的数据缩小10倍,可以这样实现: + - 首先更改yaml文件,在某个space下加入该变量 + + ```yaml + ... + train: + reader: + avg: 10 + ... + ``` -- 再更改Reader的init函数 - - ```python - from paddlerec.core.utils import envs - class TrainerReader(Reader): - def init(self): - self.avg = envs.get_global_env("avg", None, "train.reader") - def generator_sample(self, line): - pass - ``` + - 再更改Reader的init函数 + + ```python + from paddlerec.core.utils import envs + class TrainerReader(Reader): + def init(self): + self.avg = envs.get_global_env("avg", None, "train.reader") + + def generator_sample(self, line): + pass + ``` 4. 继承并实现基类中的`generate_sample(self, line)`函数,逐行读取数据。 - 该函数应返回一个可以迭代的reader方法(带有yield的函数不再是一个普通的函数,而是一个生成器generator,成为了可以迭代的对象,等价于一个数组、链表、文件、字符串etc.) diff --git a/readme.md b/readme.md index 43ddf1a6..15d29884 100644 --- a/readme.md +++ b/readme.md @@ -122,8 +122,8 @@ python -m paddlerec.run -m ./models/rank/dnn/config.yaml -e single

文档

### 背景介绍 -* [推荐系统](doc/rec_background.md) -* [分布式训练](doc/ps_background.md) +* [推荐系统介绍](doc/rec_background.md) +* [分布式深度学习介绍](doc/ps_background.md) ### 新手教程 * [环境要求](#环境要求) -- GitLab