contribute_to_paddle_cn.md 10.2 KB
Newer Older
L
update  
livc 已提交
1
# 如何贡献代码
L
livc 已提交
2

L
update  
livc 已提交
3
我们真诚地感谢您的贡献,欢迎通过 GitHub 的 fork 和 pull request 流程来提交代码。
L
livc 已提交
4

L
update  
livc 已提交
5
## 代码要求
L
livc 已提交
6 7
- 代码注释请遵守 [Doxygen](http://www.stack.nl/~dimitri/doxygen/) 的样式。
- 确保编译器选项 `WITH_STYLE_CHECK` 已打开,并且编译能通过代码样式检查。
L
update  
livc 已提交
8 9
- 所有代码必须具有单元测试。
- 通过所有单元测试。
10
- 请遵守[提交代码的一些约定](#提交代码的一些约定)
L
livc 已提交
11

L
update  
livc 已提交
12 13 14 15
以下教程将指导您提交代码。
## [Fork](https://help.github.com/articles/fork-a-repo/)

跳转到[PaddlePaddle](https://github.com/PaddlePaddle/Paddle) GitHub首页,然后单击 `Fork` 按钮,生成自己目录下的仓库,比如 <https://github.com/USERNAME/Paddle>
L
livc 已提交
16 17 18

## 克隆(Clone)

L
livc 已提交
19
将远程仓库 clone 到本地:
L
update  
livc 已提交
20 21 22 23 24

```bash
➜  git clone https://github.com/USERNAME/Paddle
cd Paddle
```
L
livc 已提交
25 26


L
livc 已提交
27 28
## 创建本地分支

L
livc 已提交
29
Paddle 目前使用[Git流分支模型](http://nvie.com/posts/a-successful-git-branching-model/)进行开发,测试,发行和维护,具体请参考 [Paddle 分支规范](https://github.com/PaddlePaddle/Paddle/blob/develop/doc/design/releasing_process.md#paddle-分支规范)
L
update  
livc 已提交
30 31

所有的 feature 和 bug fix 的开发工作都应该在一个新的分支上完成,一般从 `develop` 分支上创建新分支。
L
livc 已提交
32

L
livc 已提交
33
使用 `git checkout -b` 创建并切换到新分支。
L
livc 已提交
34

L
livc 已提交
35 36
```bash
➜  git checkout -b my-cool-stuff
L
livc 已提交
37 38
```

L
livc 已提交
39 40 41 42 43 44 45
值得注意的是,在 checkout 之前,需要保持当前分支目录 clean,否则会把 untracked 的文件也带到新分支上,这可以通过 `git status` 查看。

## 使用 `pre-commit` 钩子

Paddle 开发人员使用 [pre-commit](http://pre-commit.com/) 工具来管理 Git 预提交钩子。 它可以帮助我们格式化源代码(C++,Python),在提交(commit)前自动检查一些基本事宜(如每个文件只有一个 EOL,Git 中不要添加大文件等)。

`pre-commit`测试是 Travis-CI 中单元测试的一部分,不满足钩子的 PR 不能被提交到 Paddle,首先安装并在当前目录运行它:
L
livc 已提交
46

L
livc 已提交
47
```bash
L
livc 已提交
48 49
➜  pip install pre-commit
➜  pre-commit install
L
livc 已提交
50 51
```

L
livc 已提交
52
Paddle 使用 `clang-format` 来调整 C/C++ 源代码格式,请确保 `clang-format` 版本在 3.8 以上。
L
livc 已提交
53 54

## 开始开发
L
livc 已提交
55

L
livc 已提交
56
在本例中,我删除了 README.md 中的一行,并创建了一个新文件。
L
livc 已提交
57

L
livc 已提交
58
通过 `git status` 查看当前状态,这会提示当前目录的一些变化,同时也可以通过 `git diff` 查看文件具体被修改的内容。
L
livc 已提交
59

L
livc 已提交
60 61 62 63 64 65
```bash
➜  git status
On branch test
Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git checkout -- <file>..." to discard changes in working directory)
L
livc 已提交
66

L
livc 已提交
67
	modified:   README.md
L
livc 已提交
68

L
livc 已提交
69 70
Untracked files:
  (use "git add <file>..." to include in what will be committed)
L
livc 已提交
71

L
livc 已提交
72 73 74
	test

no changes added to commit (use "git add" and/or "git commit -a")
L
livc 已提交
75 76
```

L
livc 已提交
77 78
## 构建和测试

L
Luo Tao 已提交
79
编译 PaddlePaddle 的源码以及生成文档需要多种开发工具。为了方便大家,我们的标准开发流程是把这些工具都装进一个Docker image,称为*开发镜像*,通常名字是 `paddle:latest-dev` 或者 `paddle:[version tag]-dev``paddle:0.11.0-dev`。然后所有用 `cmake && make` 的地方(比如IDE配置里)都用 `docker run paddle:latest-dev`来代替。
L
livc 已提交
80 81 82 83

如要build这个开发镜像,在源码目录树的根目录中运行:

```bash
L
Luo Tao 已提交
84
➜  docker build -t paddle:latest-dev .
L
livc 已提交
85 86
```

L
livc 已提交
87
随后可以用这个开发镜像开始build PaddlePaddle的源码。比如如果要build一个不依赖GPU,但是支持AVX指令集,并且包括unit tests的PaddlePaddle,可以:
L
livc 已提交
88 89

```bash
L
Luo Tao 已提交
90
➜  docker run -v $(pwd):/paddle -e "WITH_GPU=OFF" -e "WITH_AVX=ON" -e "WITH_TESTING=ON" paddle:latest-dev
L
livc 已提交
91 92 93 94 95 96 97 98 99 100 101
```

这个过程除了编译PaddlePaddle为 `./build/libpaddle.so`,并且输出一个 `./build/paddle.deb`文件之外,还会输出一个 `build/Dockerfile`。我们只需要运行下面命令把编译好的PaddlePaddle打包成一个*生产镜像*`paddle:prod`):

```bash
➜  docker build -t paddle:prod -f build/Dockerfile .
```

如果要运行所有的单元测试,可以用如下命令:

```bash
L
Luo Tao 已提交
102
➜  docker run -it -v $(pwd):/paddle paddle:latest-dev bash -c "cd /paddle/build && ctest"
L
livc 已提交
103 104 105 106
```

关于构建和测试的更多信息,请参见[这篇文档](https://github.com/PaddlePaddle/Paddle/blob/develop/doc/getstarted/build_and_install/docker_install_cn.rst)

L
livc 已提交
107 108 109
## 提交(commit)

接下来我们取消对 README.md 文件的改变,然后提交新添加的 test 文件。
L
livc 已提交
110

L
livc 已提交
111 112 113 114 115 116
```bash
➜  git checkout -- README.md
➜  git status
On branch test
Untracked files:
  (use "git add <file>..." to include in what will be committed)
L
livc 已提交
117

L
livc 已提交
118 119 120 121
	test

nothing added to commit but untracked files present (use "git add" to track)
➜  git add test
L
livc 已提交
122 123
```

L
livc 已提交
124
Git 每次提交代码,都需要写提交说明,这可以让其他人知道这次提交做了哪些改变,这可以通过`git commit` 完成。
L
livc 已提交
125

L
livc 已提交
126
```bash
L
livc 已提交
127
➜  git commit
L
livc 已提交
128 129 130 131 132 133 134 135
CRLF end-lines remover...............................(no files to check)Skipped
yapf.................................................(no files to check)Skipped
Check for added large files..............................................Passed
Check for merge conflicts................................................Passed
Check for broken symlinks................................................Passed
Detect Private Key...................................(no files to check)Skipped
Fix End of Files.....................................(no files to check)Skipped
clang-formater.......................................(no files to check)Skipped
L
livc 已提交
136
[my-cool-stuff c703c041] add test file
L
livc 已提交
137 138 139 140 141 142 143 144 145
 1 file changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 233
```

## 保持本地仓库最新

在准备发起 Pull Request 之前,需要同步原仓库(<https://github.com/PaddlePaddle/Paddle>)最新的代码。

首先通过 `git remote` 查看当前远程仓库的名字。
L
livc 已提交
146

L
livc 已提交
147 148 149 150 151 152 153 154 155
```bash
➜  git remote
origin
➜  git remote -v
origin	https://github.com/USERNAME/Paddle (fetch)
origin	https://github.com/USERNAME/Paddle (push)
```

这里 origin 是我们 clone 的远程仓库的名字,也就是自己用户名下的 Paddle,接下来我们创建一个原始 Paddle 仓库的远程主机,命名为 upstream。
L
livc 已提交
156

L
livc 已提交
157 158 159 160 161
```bash
➜  git remote add upstream https://github.com/PaddlePaddle/Paddle
➜  git remote
origin
upstream
L
livc 已提交
162 163
```

L
livc 已提交
164
获取 upstream 的最新代码并更新当前分支。
L
livc 已提交
165

L
livc 已提交
166 167
```bash
➜  git fetch upstream
L
livc 已提交
168
➜  git pull upstream develop
L
livc 已提交
169
```
L
livc 已提交
170

L
livc 已提交
171
## Push 到远程仓库
L
livc 已提交
172

L
livc 已提交
173
将本地的修改推送到 GitHub 上,也就是 https://github.com/USERNAME/Paddle。
L
livc 已提交
174

L
livc 已提交
175
```bash
L
livc 已提交
176 177
# 推送到远程仓库 origin 的 my-cool-stuff 分支上
➜  git push origin my-cool-stuff
L
livc 已提交
178 179
```

L
livc 已提交
180
## 建立 Issue 并完成 Pull Request
L
livc 已提交
181

L
livc 已提交
182
建立一个 Issue 描述问题,并记录它的编号。
L
livc 已提交
183

L
livc 已提交
184
切换到所建分支,然后点击 `New pull request`
L
livc 已提交
185

L
livc 已提交
186
<img width="295" alt="screen shot 2017-04-26 at 9 09 28 pm" src="https://cloud.githubusercontent.com/assets/11692045/25436054/a6d98c66-2ac4-11e7-9cb1-18dd13150230.png">
L
livc 已提交
187 188 189

选择目标分支:

L
livc 已提交
190
<img width="750" alt="screen shot 2017-04-26 at 9 11 52 pm" src="https://cloud.githubusercontent.com/assets/11692045/25436139/f83b1e6c-2ac4-11e7-8c0e-add499023c46.png">
L
livc 已提交
191

L
livc 已提交
192
在 PR 的描述说明中,填写 `resolve #Issue编号` 可以在这个 PR 被 merge 后,自动关闭对应的 Issue,具体请见 <https://help.github.com/articles/closing-issues-via-commit-messages/>
L
livc 已提交
193

L
livc 已提交
194
接下来等待 review,如果有需要修改的地方,参照上述步骤更新 origin 中的对应分支即可。
L
livc 已提交
195

L
livc 已提交
196 197 198 199
## 删除远程分支

在 PR 被 merge 进主仓库后,我们可以在 PR 的页面删除远程仓库的分支。

L
livc 已提交
200 201 202 203 204 205 206
<img width="775" alt="screen shot 2017-04-26 at 9 18 24 pm" src="https://cloud.githubusercontent.com/assets/11692045/25436457/e4cdd472-2ac5-11e7-9272-badc76c4a23e.png">

也可以使用 `git push origin :分支名` 删除远程分支,如:

```bash
➜  git push origin :my-cool-stuff
```
L
livc 已提交
207 208 209 210 211 212 213

## 删除本地分支

最后,删除本地分支。

```bash
# 切换到 develop 分支
L
livc 已提交
214
➜  git checkout develop 
L
livc 已提交
215

L
livc 已提交
216 217
# 删除 my-cool-stuff 分支
➜  git branch -D my-cool-stuff
L
livc 已提交
218
```
L
livc 已提交
219 220

至此,我们就完成了一次代码贡献的过程。
221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239

## 提交代码的一些约定

为了使评审人在评审代码时更好地专注于代码本身,请您每次提交代码时,遵守以下约定:
1. 请保证Travis-CI 中单元测试能顺利通过。如果没过,说明提交的代码存在问题,评审人一般不做评审。
2. 提交PUll Request前:
   - 请注意commit的数量:
     - 原因:如果仅仅修改一个文件但提交了十几个commit,每个commit只做了少量的修改,这会给评审人带来很大困扰。评审人需要逐一查看每个commit才能知道做了哪些修改,且不排除commit之间的修改存在相互覆盖的情况。
     - 建议:每次提交时,保持尽量少的commit,可以通过`git commit --amend`补充上次的commit。对已经Push到远程仓库的多个commit,可以参考[squash commits after push](http://stackoverflow.com/questions/5667884/how-to-squash-commits-in-git-after-they-have-been-pushed)
   - 请注意每个commit的名称:应能反映当前commit的内容,不能太随意。
3. 如果解决了某个Issue的问题,请在该PUll Request的**第一个**评论框中加上:`fix #issue_number`,这样当该PUll Request被合并后,会自动关闭对应的Issue。关键词包括:close, closes, closed, fix, fixes, fixed, resolve, resolves, resolved,请选择合适的词汇。详细可参考[Closing issues via commit messages](https://help.github.com/articles/closing-issues-via-commit-messages)

此外,在回复评审人意见时,请您遵守以下约定:
1. 评审人的每个意见都必须回复(这是开源社区的基本礼貌,别人帮了忙,应该说谢谢):
   - 对评审意见同意且按其修改完的,给个简单的`Done`即可;
   - 对评审意见不同意的,请给出您自己的反驳理由。
2. 如果评审意见比较多:
   - 请给出总体的修改情况。
   - 请采用[start a review](https://help.github.com/articles/reviewing-proposed-changes-in-a-pull-request/)进行回复,而非直接回复的方式。原因是每个回复都会发送一封邮件,会造成邮件灾难。