.. _user_guide_prepare_data: ######## 准备数据 ######## PaddlePaddle Fluid支持两种传入数据的方式: 一种用户需要使用 :code:`fluid.layers.data` 配置数据输入层,并在 :ref:`api_guide_executor` 或 :ref:`api_guide_parallel_executor` 中,使用 :code:`executor.run(feed=...)` 传入训练数据; 另一种用户需要先将训练数据 转换成 Paddle 识别的 :ref:`api_guide_recordio_file_format` , 再使用 :code:`fluid.layers.open_files` 以及 :ref:`api_guide_reader` 配置数据读取。 这两种准备数据方法的比较如下: .. _user_guide_prepare_data_comparision: +------------+----------------------------------+---------------------------------------+ | | Feed数据 | 使用Reader | +============+==================================+=======================================+ | API接口 | :code:`executor.run(feed=...)` | :ref:`api_guide_reader` | +------------+----------------------------------+---------------------------------------+ | 数据格式 | Numpy Array | :ref:`api_guide_recordio_file_format` | +------------+----------------------------------+---------------------------------------+ | 数据增强 | Python端使用其他库完成 | 使用Fluid中的Operator 完成 | +------------+----------------------------------+---------------------------------------+ | 速度 | 慢 | 快 | +------------+----------------------------------+---------------------------------------+ | 推荐用途 | 调试模型 | 工业训练 | +------------+----------------------------------+---------------------------------------+ 这些准备数据的详细使用方法,请参考: .. toctree:: :maxdepth: 2 feeding_data use_recordio_reader ############# Python Reader ############# 为了方便用户在Python中定义数据处理流程,PaddlePaddle Fluid支持 Python Reader, 具体请参考: .. toctree:: :maxdepth: 2 reader.md