contribute_to_paddle_cn.md 8.0 KB
Newer Older
L
update  
livc 已提交
1
# 如何贡献代码
L
livc 已提交
2

L
update  
livc 已提交
3
我们真诚地感谢您的贡献,欢迎通过 GitHub 的 fork 和 pull request 流程来提交代码。
L
livc 已提交
4

L
update  
livc 已提交
5
## 代码要求
L
livc 已提交
6 7
- 代码注释请遵守 [Doxygen](http://www.stack.nl/~dimitri/doxygen/) 的样式。
- 确保编译器选项 `WITH_STYLE_CHECK` 已打开,并且编译能通过代码样式检查。
L
update  
livc 已提交
8 9
- 所有代码必须具有单元测试。
- 通过所有单元测试。
L
livc 已提交
10

L
update  
livc 已提交
11 12 13 14
以下教程将指导您提交代码。
## [Fork](https://help.github.com/articles/fork-a-repo/)

跳转到[PaddlePaddle](https://github.com/PaddlePaddle/Paddle) GitHub首页,然后单击 `Fork` 按钮,生成自己目录下的仓库,比如 <https://github.com/USERNAME/Paddle>
L
livc 已提交
15 16 17

## 克隆(Clone)

L
livc 已提交
18
将远程仓库 clone 到本地:
L
update  
livc 已提交
19 20 21 22 23

```bash
➜  git clone https://github.com/USERNAME/Paddle
cd Paddle
```
L
livc 已提交
24 25


L
livc 已提交
26 27
## 创建本地分支

L
livc 已提交
28
Paddle 目前使用[Git流分支模型](http://nvie.com/posts/a-successful-git-branching-model/)进行开发,测试,发行和维护,具体请参考 [Paddle 分支规范](https://github.com/PaddlePaddle/Paddle/blob/develop/doc/design/releasing_process.md#paddle-分支规范)
L
update  
livc 已提交
29 30

所有的 feature 和 bug fix 的开发工作都应该在一个新的分支上完成,一般从 `develop` 分支上创建新分支。
L
livc 已提交
31

L
livc 已提交
32
使用 `git checkout -b` 创建并切换到新分支。
L
livc 已提交
33

L
livc 已提交
34 35
```bash
➜  git checkout -b my-cool-stuff
L
livc 已提交
36 37
```

L
livc 已提交
38 39 40 41 42 43 44
值得注意的是,在 checkout 之前,需要保持当前分支目录 clean,否则会把 untracked 的文件也带到新分支上,这可以通过 `git status` 查看。

## 使用 `pre-commit` 钩子

Paddle 开发人员使用 [pre-commit](http://pre-commit.com/) 工具来管理 Git 预提交钩子。 它可以帮助我们格式化源代码(C++,Python),在提交(commit)前自动检查一些基本事宜(如每个文件只有一个 EOL,Git 中不要添加大文件等)。

`pre-commit`测试是 Travis-CI 中单元测试的一部分,不满足钩子的 PR 不能被提交到 Paddle,首先安装并在当前目录运行它:
L
livc 已提交
45

L
livc 已提交
46
```bash
L
livc 已提交
47 48
➜  pip install pre-commit
➜  pre-commit install
L
livc 已提交
49 50
```

L
livc 已提交
51
Paddle 使用 `clang-format` 来调整 C/C++ 源代码格式,请确保 `clang-format` 版本在 3.8 以上。
L
livc 已提交
52 53

## 开始开发
L
livc 已提交
54

L
livc 已提交
55
在本例中,我删除了 README.md 中的一行,并创建了一个新文件。
L
livc 已提交
56

L
livc 已提交
57
通过 `git status` 查看当前状态,这会提示当前目录的一些变化,同时也可以通过 `git diff` 查看文件具体被修改的内容。
L
livc 已提交
58

L
livc 已提交
59 60 61 62 63 64
```bash
➜  git status
On branch test
Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git checkout -- <file>..." to discard changes in working directory)
L
livc 已提交
65

L
livc 已提交
66
	modified:   README.md
L
livc 已提交
67

L
livc 已提交
68 69
Untracked files:
  (use "git add <file>..." to include in what will be committed)
L
livc 已提交
70

L
livc 已提交
71 72 73
	test

no changes added to commit (use "git add" and/or "git commit -a")
L
livc 已提交
74 75
```

L
livc 已提交
76 77 78 79 80 81 82 83 84 85
## 构建和测试

编译 PaddlePaddle 的源码以及生成文档需要多种开发工具。为了方便大家,我们的标准开发流程是把这些工具都装进一个Docker image,称为*开发镜像*,通常名字是 `paddle:dev`。然后所有用 `cmake && make` 的地方(比如IDE配置里)都用 `docker run paddle:dev`来代替。

如要build这个开发镜像,在源码目录树的根目录中运行:

```bash
➜  docker build -t paddle:dev .
```

L
livc 已提交
86
随后可以用这个开发镜像开始build PaddlePaddle的源码。比如如果要build一个不依赖GPU,但是支持AVX指令集,并且包括unit tests的PaddlePaddle,可以:
L
livc 已提交
87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

```bash
➜  docker run -v $(pwd):/paddle -e "WITH_GPU=OFF" -e "WITH_AVX=ON" -e "WITH_TEST=ON" paddle:dev
```

这个过程除了编译PaddlePaddle为 `./build/libpaddle.so`,并且输出一个 `./build/paddle.deb`文件之外,还会输出一个 `build/Dockerfile`。我们只需要运行下面命令把编译好的PaddlePaddle打包成一个*生产镜像*`paddle:prod`):

```bash
➜  docker build -t paddle:prod -f build/Dockerfile .
```

如果要运行所有的单元测试,可以用如下命令:

```bash
➜  docker run -it -v $(pwd):/paddle paddle:dev bash -c "cd /paddle/build && ctest"
```

关于构建和测试的更多信息,请参见[这篇文档](https://github.com/PaddlePaddle/Paddle/blob/develop/doc/getstarted/build_and_install/docker_install_cn.rst)

L
livc 已提交
106 107 108
## 提交(commit)

接下来我们取消对 README.md 文件的改变,然后提交新添加的 test 文件。
L
livc 已提交
109

L
livc 已提交
110 111 112 113 114 115
```bash
➜  git checkout -- README.md
➜  git status
On branch test
Untracked files:
  (use "git add <file>..." to include in what will be committed)
L
livc 已提交
116

L
livc 已提交
117 118 119 120
	test

nothing added to commit but untracked files present (use "git add" to track)
➜  git add test
L
livc 已提交
121 122
```

L
livc 已提交
123
Git 每次提交代码,都需要写提交说明,这可以让其他人知道这次提交做了哪些改变,这可以通过`git commit` 完成。
L
livc 已提交
124

L
livc 已提交
125
```bash
L
livc 已提交
126
➜  git commit
L
livc 已提交
127 128 129 130 131 132 133 134
CRLF end-lines remover...............................(no files to check)Skipped
yapf.................................................(no files to check)Skipped
Check for added large files..............................................Passed
Check for merge conflicts................................................Passed
Check for broken symlinks................................................Passed
Detect Private Key...................................(no files to check)Skipped
Fix End of Files.....................................(no files to check)Skipped
clang-formater.......................................(no files to check)Skipped
L
livc 已提交
135
[my-cool-stuff c703c041] add test file
L
livc 已提交
136 137 138 139 140 141 142 143 144
 1 file changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 233
```

## 保持本地仓库最新

在准备发起 Pull Request 之前,需要同步原仓库(<https://github.com/PaddlePaddle/Paddle>)最新的代码。

首先通过 `git remote` 查看当前远程仓库的名字。
L
livc 已提交
145

L
livc 已提交
146 147 148 149 150 151 152 153 154
```bash
➜  git remote
origin
➜  git remote -v
origin	https://github.com/USERNAME/Paddle (fetch)
origin	https://github.com/USERNAME/Paddle (push)
```

这里 origin 是我们 clone 的远程仓库的名字,也就是自己用户名下的 Paddle,接下来我们创建一个原始 Paddle 仓库的远程主机,命名为 upstream。
L
livc 已提交
155

L
livc 已提交
156 157 158 159 160
```bash
➜  git remote add upstream https://github.com/PaddlePaddle/Paddle
➜  git remote
origin
upstream
L
livc 已提交
161 162
```

L
livc 已提交
163
获取 upstream 的最新代码并更新当前分支。
L
livc 已提交
164

L
livc 已提交
165 166
```bash
➜  git fetch upstream
L
livc 已提交
167
➜  git pull upstream develop
L
livc 已提交
168
```
L
livc 已提交
169

L
livc 已提交
170
## Push 到远程仓库
L
livc 已提交
171

L
livc 已提交
172
将本地的修改推送到 GitHub 上,也就是 https://github.com/USERNAME/Paddle。
L
livc 已提交
173

L
livc 已提交
174
```bash
L
livc 已提交
175 176
# 推送到远程仓库 origin 的 my-cool-stuff 分支上
➜  git push origin my-cool-stuff
L
livc 已提交
177 178
```

L
livc 已提交
179
## 建立 Issue 并完成 Pull Request
L
livc 已提交
180

L
livc 已提交
181
建立一个 Issue 描述问题,并记录它的编号。
L
livc 已提交
182

L
livc 已提交
183
切换到所建分支,然后点击 `New pull request`
L
livc 已提交
184

L
livc 已提交
185
<img width="295" alt="screen shot 2017-04-26 at 9 09 28 pm" src="https://cloud.githubusercontent.com/assets/11692045/25436054/a6d98c66-2ac4-11e7-9cb1-18dd13150230.png">
L
livc 已提交
186 187 188

选择目标分支:

L
livc 已提交
189
<img width="750" alt="screen shot 2017-04-26 at 9 11 52 pm" src="https://cloud.githubusercontent.com/assets/11692045/25436139/f83b1e6c-2ac4-11e7-8c0e-add499023c46.png">
L
livc 已提交
190

L
livc 已提交
191
在 PR 的描述说明中,填写 `resolve #Issue编号` 可以在这个 PR 被 merge 后,自动关闭对应的 Issue,具体请见 <https://help.github.com/articles/closing-issues-via-commit-messages/>
L
livc 已提交
192

L
livc 已提交
193
接下来等待 review,如果有需要修改的地方,参照上述步骤更新 origin 中的对应分支即可。
L
livc 已提交
194

L
livc 已提交
195 196 197 198
## 删除远程分支

在 PR 被 merge 进主仓库后,我们可以在 PR 的页面删除远程仓库的分支。

L
livc 已提交
199 200 201 202 203 204 205
<img width="775" alt="screen shot 2017-04-26 at 9 18 24 pm" src="https://cloud.githubusercontent.com/assets/11692045/25436457/e4cdd472-2ac5-11e7-9272-badc76c4a23e.png">

也可以使用 `git push origin :分支名` 删除远程分支,如:

```bash
➜  git push origin :my-cool-stuff
```
L
livc 已提交
206 207 208 209 210 211 212

## 删除本地分支

最后,删除本地分支。

```bash
# 切换到 develop 分支
L
livc 已提交
213
➜  git checkout develop 
L
livc 已提交
214

L
livc 已提交
215 216
# 删除 my-cool-stuff 分支
➜  git branch -D my-cool-stuff
L
livc 已提交
217
```
L
livc 已提交
218 219

至此,我们就完成了一次代码贡献的过程。