RELEASE.cn.md 4.5 KB
Newer Older
chrisxu2014's avatar
chrisxu2014 已提交
1 2
# v0.10.0版本

chrisxu2014's avatar
chrisxu2014 已提交
3
我们非常高兴发布了PaddlePaddle V0.10.0版,并开发了新的[Python API](http://research.baidu.com/paddlepaddles-new-api-simplifies-deep-learning-programs/)
chrisxu2014's avatar
chrisxu2014 已提交
4

chrisxu2014's avatar
chrisxu2014 已提交
5
- 旧的Python API由于难以学习和使用已经过时了。使用旧版本的API至少需要两份python文件,分别是定义数据生成器和定义网络拓扑结构的文件。用户通过运行`paddle_trainer`的C++程序来启动PaddlePaddle任务,该程序调用Python解释器来运行定义网络拓扑结构的文件,然后通过迭代加载数据生成器提供的小批量数据启动训练循环。这与Python的现代编辑方式不符,比如Jupyter Notebook。
chrisxu2014's avatar
chrisxu2014 已提交
6

chrisxu2014's avatar
chrisxu2014 已提交
7
- 新版的API被称为 *V2 API*,允许我们在单个.py文件中,通过编辑更短的Python程序来定义网络结构和数据。此外,该Python程序也可以在Jupyter Notebook中运行,因为PaddlePaddle可以作为共享库来被Python程序加载和使用。
chrisxu2014's avatar
chrisxu2014 已提交
8 9 10

基于新的API,我们提供了一个在线的学习文档 [Deep Learning 101](http://book.paddlepaddle.org/index.en.html) 及其[中文版本](http://book.paddlepaddle.org/)

chrisxu2014's avatar
chrisxu2014 已提交
11
我们还致力于迭代更新新版API的在线文档,并将新版API引入分布式集群(包括MPI和Kubernetes)训练中。我们将在下一个版本中发布更多的内容。
chrisxu2014's avatar
chrisxu2014 已提交
12 13 14 15

## 新特点

* 发布新版[Python API](http://research.baidu.com/paddlepaddles-new-api-simplifies-deep-learning-programs/)
chrisxu2014's avatar
chrisxu2014 已提交
16
* 发布深度学习系列课程 [Deep Learning 101](http://book.paddlepaddle.org/index.en.html) 及其[中文版本](http://book.paddlepaddle.org/)
chrisxu2014's avatar
chrisxu2014 已提交
17 18 19 20 21 22 23 24 25 26 27 28 29
* 支持矩形输入的CNN。
* 为seqlastin和seqfirstin提供stride pooling。
*`trainer_config_helpers`中暴露`seq_concat_layer/seq_reshape_layer`
* 添加公共数据集包:CIFAR,MNIST,IMDB,WMT14,CONLL05,movielens,imikolov。
* 针对Single Shot Multibox Detection增加 Prior box layer。
* 增加光滑的L1损失。
* 在V2 API中增加 data reader 创建器和修饰器。
* 增加cmrnorm投影的CPU实现。


## 改进

* 提供`paddle_trainer`的Python virtualenv支持。
chrisxu2014's avatar
chrisxu2014 已提交
30
* 增加代码自动格式化的pre-commit hooks。
chrisxu2014's avatar
chrisxu2014 已提交
31 32
* 升级protobuf到3.x版本。
* 在Python数据生成器中提供一个检测数据类型的选项。
chrisxu2014's avatar
chrisxu2014 已提交
33
* 加速GPU中average层的后向反馈计算。
chrisxu2014's avatar
chrisxu2014 已提交
34 35
* 细化文档。
* 使用Travis-CI检查文档中的死链接。
chrisxu2014's avatar
chrisxu2014 已提交
36
* 增加解释`sparse_vector`的示例。
chrisxu2014's avatar
chrisxu2014 已提交
37 38 39 40 41 42 43 44 45
* 在layer_math.py中添加ReLU。
* 简化Quick Start示例中的数据处理流程。
* 支持CUDNN Deconv。
* 在v2 API中增加数据feeder。
* 在情感分析示例的演示中增加对标准输入流中样本的预测。
* 提供图像预处理的多进程接口。
* 增加V1 API的基准文档。
*`layer_math.py`中增加ReLU。
* 提供公共数据集的自动下载包。
chrisxu2014's avatar
chrisxu2014 已提交
46
*`Argument::sumCost`重新命名为`Argument::sum`,并暴露给python。
chrisxu2014's avatar
chrisxu2014 已提交
47 48
* 为矩阵相关的表达式评估增加一个新的`TensorExpression`实现。
* 增加延迟分配来优化批处理多表达式计算。
chrisxu2014's avatar
chrisxu2014 已提交
49
* 增加抽象的类函数及其实现:
chrisxu2014's avatar
chrisxu2014 已提交
50 51 52 53 54 55 56
  * `PadFunc``PadGradFunc`
  * `ContextProjectionForwardFunc``ContextProjectionBackwardFunc`
  * `CosSimBackward``CosSimBackwardFunc`
  * `CrossMapNormalFunc``CrossMapNormalGradFunc`
  * `MulFunc`
* 增加`AutoCompare``FunctionCompare`类,使得编写比较gpu和cpu版本函数的单元测试更容易。
* 生成`libpaddle_test_main.a`并删除测试文件内的主函数。
chrisxu2014's avatar
chrisxu2014 已提交
57 58
* 支持PyDataProvider2中numpy的稠密向量。
* 清理代码库,删除一些复制粘贴的代码片段:
chrisxu2014's avatar
chrisxu2014 已提交
59 60 61 62 63 64 65 66 67 68 69 70 71 72
  * 增加`SparseRowMatrix`的抽样类`RowBuffer`
  * 清理`GradientMachine`的接口。
  * 在layer中增加`override`关键字。
  * 简化`Evaluator::create`,使用`ClassRegister`来创建`Evaluator`
* 下载演示的数据集时检查MD5校验。
* 添加`paddle::Error`,用于替代Paddle中的`LOG(FATAL)`


## 错误修复

* 检查`recurrent_group`的layer输入类型。
* 不要用.cu源文件运行`clang-format`
* 修复`LogActivation`的使用错误。
* 修复运行`test_layerHelpers`多次的错误。
chrisxu2014's avatar
chrisxu2014 已提交
73
* 修复seq2seq示例超出消息大小限制的错误。
chrisxu2014's avatar
chrisxu2014 已提交
74 75 76 77 78 79 80
* 修复在GPU模式下dataprovider转换的错误。
* 修复`GatedRecurrentLayer`中的错误。
* 修复在测试多个模型时`BatchNorm`的错误。
* 修复paramRelu在单元测试时崩溃的错误。
* 修复`CpuSparseMatrix`编译时相关的警告。
* 修复`MultiGradientMachine``trainer_count > batch_size`时的错误。
* 修复`PyDataProvider2`阻止异步加载数据的错误。