contribute_to_paddle_cn.md 8.0 KB
Newer Older
L
update  
livc 已提交
1
# 如何贡献代码
L
livc 已提交
2

L
update  
livc 已提交
3
我们真诚地感谢您的贡献,欢迎通过 GitHub 的 fork 和 pull request 流程来提交代码。
L
livc 已提交
4

L
update  
livc 已提交
5
## 代码要求
L
livc 已提交
6 7
- 代码注释请遵守 [Doxygen](http://www.stack.nl/~dimitri/doxygen/) 的样式。
- 确保编译器选项 `WITH_STYLE_CHECK` 已打开,并且编译能通过代码样式检查。
L
update  
livc 已提交
8 9
- 所有代码必须具有单元测试。
- 通过所有单元测试。
L
livc 已提交
10

L
update  
livc 已提交
11 12 13 14
以下教程将指导您提交代码。
## [Fork](https://help.github.com/articles/fork-a-repo/)

跳转到[PaddlePaddle](https://github.com/PaddlePaddle/Paddle) GitHub首页,然后单击 `Fork` 按钮,生成自己目录下的仓库,比如 <https://github.com/USERNAME/Paddle>
L
livc 已提交
15 16 17

## 克隆(Clone)

L
livc 已提交
18
将远程仓库 clone 到本地:
L
update  
livc 已提交
19 20 21 22 23

```bash
➜  git clone https://github.com/USERNAME/Paddle
cd Paddle
```
L
livc 已提交
24 25


L
livc 已提交
26 27
## 创建本地分支

L
livc 已提交
28
Paddle 目前使用[Git流分支模型](http://nvie.com/posts/a-successful-git-branching-model/)进行开发,测试,发行和维护,具体请参考 [Paddle 分支规范](https://github.com/PaddlePaddle/Paddle/blob/develop/doc/design/releasing_process.md#paddle-分支规范)
L
update  
livc 已提交
29 30

所有的 feature 和 bug fix 的开发工作都应该在一个新的分支上完成,一般从 `develop` 分支上创建新分支。
L
livc 已提交
31

L
livc 已提交
32
使用 `git checkout -b` 创建并切换到新分支。
L
livc 已提交
33

L
livc 已提交
34 35
```bash
➜  git checkout -b my-cool-stuff
L
livc 已提交
36 37
```

L
livc 已提交
38 39 40 41 42 43 44
值得注意的是,在 checkout 之前,需要保持当前分支目录 clean,否则会把 untracked 的文件也带到新分支上,这可以通过 `git status` 查看。

## 使用 `pre-commit` 钩子

Paddle 开发人员使用 [pre-commit](http://pre-commit.com/) 工具来管理 Git 预提交钩子。 它可以帮助我们格式化源代码(C++,Python),在提交(commit)前自动检查一些基本事宜(如每个文件只有一个 EOL,Git 中不要添加大文件等)。

`pre-commit`测试是 Travis-CI 中单元测试的一部分,不满足钩子的 PR 不能被提交到 Paddle,首先安装并在当前目录运行它:
L
livc 已提交
45

L
livc 已提交
46
```bash
L
livc 已提交
47 48
➜  pip install pre-commit
➜  pre-commit install
L
livc 已提交
49 50
```

L
livc 已提交
51
Paddle 使用 `clang-format` 来调整 C/C++ 源代码格式,请确保 `clang-format` 版本在 3.8 以上。
L
livc 已提交
52 53

## 开始开发
L
livc 已提交
54

L
livc 已提交
55
在本例中,我删除了 README.md 中的一行,并创建了一个新文件。
L
livc 已提交
56

L
livc 已提交
57
通过 `git status` 查看当前状态,这会提示当前目录的一些变化,同时也可以通过 `git diff` 查看文件具体被修改的内容。
L
livc 已提交
58

L
livc 已提交
59 60 61 62 63 64
```bash
➜  git status
On branch test
Changes not staged for commit:
  (use "git add <file>..." to update what will be committed)
  (use "git checkout -- <file>..." to discard changes in working directory)
L
livc 已提交
65

L
livc 已提交
66
	modified:   README.md
L
livc 已提交
67

L
livc 已提交
68 69
Untracked files:
  (use "git add <file>..." to include in what will be committed)
L
livc 已提交
70

L
livc 已提交
71 72 73
	test

no changes added to commit (use "git add" and/or "git commit -a")
L
livc 已提交
74 75
```

L
livc 已提交
76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105
## 构建和测试

编译 PaddlePaddle 的源码以及生成文档需要多种开发工具。为了方便大家,我们的标准开发流程是把这些工具都装进一个Docker image,称为*开发镜像*,通常名字是 `paddle:dev`。然后所有用 `cmake && make` 的地方(比如IDE配置里)都用 `docker run paddle:dev`来代替。

如要build这个开发镜像,在源码目录树的根目录中运行:

```bash
➜  docker build -t paddle:dev .
```

随后可以用这个开发镜像开build PaddlePaddle的源码。比如如果要build一个不依赖GPU,但是支持AVX指令集,并且包括unit tests的PaddlePaddle,可以:

```bash
➜  docker run -v $(pwd):/paddle -e "WITH_GPU=OFF" -e "WITH_AVX=ON" -e "WITH_TEST=ON" paddle:dev
```

这个过程除了编译PaddlePaddle为 `./build/libpaddle.so`,并且输出一个 `./build/paddle.deb`文件之外,还会输出一个 `build/Dockerfile`。我们只需要运行下面命令把编译好的PaddlePaddle打包成一个*生产镜像*`paddle:prod`):

```bash
➜  docker build -t paddle:prod -f build/Dockerfile .
```

如果要运行所有的单元测试,可以用如下命令:

```bash
➜  docker run -it -v $(pwd):/paddle paddle:dev bash -c "cd /paddle/build && ctest"
```

关于构建和测试的更多信息,请参见[这篇文档](https://github.com/PaddlePaddle/Paddle/blob/develop/doc/getstarted/build_and_install/docker_install_cn.rst)

L
livc 已提交
106 107 108
## 提交(commit)

接下来我们取消对 README.md 文件的改变,然后提交新添加的 test 文件。
L
livc 已提交
109

L
livc 已提交
110 111 112 113 114 115
```bash
➜  git checkout -- README.md
➜  git status
On branch test
Untracked files:
  (use "git add <file>..." to include in what will be committed)
L
livc 已提交
116

L
livc 已提交
117 118 119 120
	test

nothing added to commit but untracked files present (use "git add" to track)
➜  git add test
L
livc 已提交
121 122
```

L
livc 已提交
123
Git 每次提交代码,都需要写提交说明,这可以让其他人知道这次提交做了哪些改变,这可以通过`git commit` 完成。
L
livc 已提交
124

L
livc 已提交
125
```bash
L
livc 已提交
126
➜  git commit
L
livc 已提交
127 128 129 130 131 132 133 134
CRLF end-lines remover...............................(no files to check)Skipped
yapf.................................................(no files to check)Skipped
Check for added large files..............................................Passed
Check for merge conflicts................................................Passed
Check for broken symlinks................................................Passed
Detect Private Key...................................(no files to check)Skipped
Fix End of Files.....................................(no files to check)Skipped
clang-formater.......................................(no files to check)Skipped
L
livc 已提交
135
[my-cool-stuff c703c041] add test file
L
livc 已提交
136 137 138 139 140 141 142 143 144
 1 file changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 233
```

## 保持本地仓库最新

在准备发起 Pull Request 之前,需要同步原仓库(<https://github.com/PaddlePaddle/Paddle>)最新的代码。

首先通过 `git remote` 查看当前远程仓库的名字。
L
livc 已提交
145

L
livc 已提交
146 147 148 149 150 151 152 153 154
```bash
➜  git remote
origin
➜  git remote -v
origin	https://github.com/USERNAME/Paddle (fetch)
origin	https://github.com/USERNAME/Paddle (push)
```

这里 origin 是我们 clone 的远程仓库的名字,也就是自己用户名下的 Paddle,接下来我们创建一个原始 Paddle 仓库的远程主机,命名为 upstream。
L
livc 已提交
155

L
livc 已提交
156 157 158 159 160
```bash
➜  git remote add upstream https://github.com/PaddlePaddle/Paddle
➜  git remote
origin
upstream
L
livc 已提交
161 162
```

L
livc 已提交
163
获取 upstream 的最新代码并更新当前分支。
L
livc 已提交
164

L
livc 已提交
165 166
```bash
➜  git fetch upstream
L
livc 已提交
167
➜  git pull upstream develop
L
livc 已提交
168
```
L
livc 已提交
169

L
livc 已提交
170
## Push 到远程仓库
L
livc 已提交
171

L
livc 已提交
172
将本地的修改推送到 GitHub 上,也就是 https://github.com/USERNAME/Paddle。
L
livc 已提交
173

L
livc 已提交
174
```bash
L
livc 已提交
175 176
# 推送到远程仓库 origin 的 my-cool-stuff 分支上
➜  git push origin my-cool-stuff
L
livc 已提交
177 178
```

L
livc 已提交
179
## 建立 Issue 并完成 Pull Request
L
livc 已提交
180

L
livc 已提交
181
建立一个 Issue 描述问题,并记录它的编号。
L
livc 已提交
182

L
livc 已提交
183
切换到所建分支,然后点击 `New pull request`
L
livc 已提交
184

L
livc 已提交
185
<img width="295" alt="screen shot 2017-04-26 at 9 09 28 pm" src="https://cloud.githubusercontent.com/assets/11692045/25436054/a6d98c66-2ac4-11e7-9cb1-18dd13150230.png">
L
livc 已提交
186 187 188

选择目标分支:

L
livc 已提交
189
<img width="750" alt="screen shot 2017-04-26 at 9 11 52 pm" src="https://cloud.githubusercontent.com/assets/11692045/25436139/f83b1e6c-2ac4-11e7-8c0e-add499023c46.png">
L
livc 已提交
190

L
livc 已提交
191
在 PR 的描述说明中,填写 `resolve #Issue编号` 可以在这个 PR 被 merge 后,自动关闭对应的 Issue,具体请见 <https://help.github.com/articles/closing-issues-via-commit-messages/>
L
livc 已提交
192

L
livc 已提交
193
接下来等待 review,如果有需要修改的地方,参照上述步骤更新 origin 中的对应分支即可。
L
livc 已提交
194

L
livc 已提交
195 196 197 198
## 删除远程分支

在 PR 被 merge 进主仓库后,我们可以在 PR 的页面删除远程仓库的分支。

L
livc 已提交
199 200 201 202 203 204 205
<img width="775" alt="screen shot 2017-04-26 at 9 18 24 pm" src="https://cloud.githubusercontent.com/assets/11692045/25436457/e4cdd472-2ac5-11e7-9272-badc76c4a23e.png">

也可以使用 `git push origin :分支名` 删除远程分支,如:

```bash
➜  git push origin :my-cool-stuff
```
L
livc 已提交
206 207 208 209 210 211 212

## 删除本地分支

最后,删除本地分支。

```bash
# 切换到 develop 分支
L
livc 已提交
213
➜  git checkout develop 
L
livc 已提交
214

L
livc 已提交
215 216
# 删除 my-cool-stuff 分支
➜  git branch -D my-cool-stuff
L
livc 已提交
217
```
L
livc 已提交
218 219

至此,我们就完成了一次代码贡献的过程。