add note message

b3827473 · Yancey1989 · af8c7288 · b3827473
隐藏空白更改
内联并排

Showing with 4 addition and 0 deletion

doc/fluid/design/dist_train/large_model.md doc/fluid/design/dist_train/large_model.md +4 -0

未找到文件。
--- a/doc/fluid/design/dist_train/large_model.md
+++ b/doc/fluid/design/dist_train/large_model.md
@@ -11,6 +11,10 @@ the gradient to Parameter Server to execute the optimize program.
 ## Design
+**NOTE**: this approach is a feature of Fluid distributed trianing, maybe you want
+to know [Distributed Architecture](./distributed_architecture.md) and
+[Parameter Server](./parameter_server.md) before reading the following content.
 Fluid large model distributed training use 
 [Distributed Transpiler](./parameter_server.md#distributed-transpiler) to split
 a large parameter into multiple parameters which stored on Parameter Server, and