488.md 18.3 KB
Newer Older
Lab机器人's avatar
readme  
Lab机器人 已提交
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324
# Replication (Geo)

> 原文:[https://docs.gitlab.com/ee/administration/geo/replication/](https://docs.gitlab.com/ee/administration/geo/replication/)

*   [Overview](#overview)
*   [Use cases](#use-cases)
*   [How it works](#how-it-works)
    *   [Architecture](#architecture)
*   [Requirements for running Geo](#requirements-for-running-geo)
    *   [Firewall rules](#firewall-rules)
    *   [LDAP](#ldap)
    *   [Geo Tracking Database](#geo-tracking-database)
    *   [Geo Log Cursor](#geo-log-cursor)
*   [Setup instructions](#setup-instructions)
    *   [Using Omnibus GitLab](#using-omnibus-gitlab)
*   [Post-installation documentation](#post-installation-documentation)
    *   [Configuring Geo](#configuring-geo)
    *   [Updating Geo](#updating-geo)
    *   [Pausing and resuming replication](#pausing-and-resuming-replication)
    *   [Configuring Geo for multiple nodes](#configuring-geo-for-multiple-nodes)
    *   [Configuring Geo with Object Storage](#configuring-geo-with-object-storage)
    *   [Disaster Recovery](#disaster-recovery)
    *   [Replicating the Container Registry](#replicating-the-container-registry)
    *   [Security Review](#security-review)
    *   [Tuning Geo](#tuning-geo)
    *   [Set up a location-aware Git URL](#set-up-a-location-aware-git-url)
*   [Remove Geo node](#remove-geo-node)
*   [Disable Geo](#disable-geo)
*   [Current limitations](#current-limitations)
    *   [Limitations on replication/verification](#limitations-on-replicationverification)
*   [Frequently Asked Questions](#frequently-asked-questions)
*   [Log files](#log-files)
*   [Troubleshooting](#troubleshooting)

# Replication (Geo)[](#replication-geo-premium-only "Permalink")

版本历史

*   在 GitLab 企业版 8.9 中引入.
*   与组合使用地理[多节点架构](../../reference_architectures/index.html)在考虑**一般可用** (GA) [GitLab 高级](https://about.gitlab.com/pricing/) 10.4\.

使用 Geo 复制是广泛分布的开发团队的解决方案.

## Overview[](#overview "Permalink")

对于远离单个 GitLab 实例的团队而言,获取大型存储库可能需要很长时间.

Geo 提供您的 GitLab 实例的本地只读实例. 这样可以减少克隆和获取大型存储库所需的时间,从而加快开发速度.

**注意:**在设置 Geo 之前,请仔细检查[要求](#requirements-for-running-geo) .

有关 Geo 的视频介绍,请参见[GitLab Geo-GitLab 功能介绍](https://www.youtube.com/watch?v=-HDLxSjEh6w) .

**注意:**从发布到发布,Geo 进行了重大更改. **支持**升级和[记录](#updating-geo) ,但你应该确保您使用的文件的正确的版本进行安装.

为确保您使用的文档版本正确,请[在 GitLab.com 上](https://gitlab.com/gitlab-org/gitlab/blob/master/doc/administration/geo/replication/index.md)导航[至此页面的源版本](https://gitlab.com/gitlab-org/gitlab/blob/master/doc/administration/geo/replication/index.md) ,然后从**Switch 分支/标签**下拉列表中选择适当的版本. 例如, [`v11.2.3-ee`](https://gitlab.com/gitlab-org/gitlab/blob/v11.2.3-ee/doc/administration/geo/replication/index.md) .

## Use cases[](#use-cases "Permalink")

实施 Geo 具有以下好处:

*   将分布式开发人员克隆和获取大型存储库和项目所需的时间从几分钟减少到几秒钟.
*   无论您身在何处,都可以使所有开发人员共同贡献想法并并行工作.
*   平衡**主**节点和**辅助**节点之间的只读负载.

此外,它:

*   除读取 GitLab Web 界面中可用的任何数据外,还可用于克隆和获取项目(请参阅[当前限制](#current-limitations) ).
*   克服远程办公室之间的慢速连接,通过提高分布式团队的速度来节省时间.
*   帮助减少自动任务,自定义集成和内部工作流程的加载时间.
*   可以在[灾难恢复](../disaster_recovery/index.html)方案中快速故障转移到**辅助**节点.
*   允许[计划的故障转移](../disaster_recovery/planned_failover.html)**辅助**节点.

地理位置提供:

*   只读**辅助**节点:维护一个**主** GitLab 节点,同时仍为每个分布式团队启用只读**辅助**节点.
*   身份验证系统挂钩: **辅助**节点从**主**实例接收所有身份验证数据(例如用户帐户和登录名).
*   直观的用户界面: **辅助**节点使用团队已习惯的相同 Web 界面. 此外,还有可视通知会阻止写操作,并清楚表明用户在**辅助**节点上.

## How it works[](#how-it-works "Permalink")

除了读取任何数据外,您的 Geo 实例还可用于克隆和获取项目. 这将使在较大距离上使用大型存储库的速度更快.

[![Geo overview](img/c17db26d06341055b4834c8be77c604b.png)](img/geo_overview.png)

启用地理位置后,:

*   原始实例称为**主要**节点.
*   复制的只读节点称为**辅助**节点.

请记住:

*   **辅助**节点与**主**节点对话以:
    *   获取用于登录的用户数据(API).
    *   复制存储库,LFS 对象和附件(HTTPS + JWT).
*   从 GitLab Premium 10.0 开始, **主**节点不再与**辅助**节点对话以通知更改(API).
*   [GitLab Premium](https://about.gitlab.com/pricing/#self-managed) 11.3 中[引入](https://about.gitlab.com/releases/2018/09/22/gitlab-11-3-released/)了直接推送到**辅助**节点(对于 HTTP 和 SSH,包括 Git LFS).
*   当前的实施存在[局限性](#current-limitations) .

### Architecture[](#architecture "Permalink")

下图说明了 Geo 的基础体系结构.

[![Geo architecture](img/5f13fe556b8940c2e698facdc219d16a.png)](img/geo_architecture.png)

在此图中:

***主**节点和一个**辅助**节点的详细信息.
*   只能在**主**节点上执行对数据库的写入. **辅助**节点通过 PostgreSQL 流复制接收数据库更新.
*   如果存在,则应将[LDAP 服务器](#ldap)配置为针对[灾难恢复](../disaster_recovery/index.html)方案进行复制.
*   **辅助**节点使用受 JWT 保护的特殊授权对**主要**节点执行不同类型的同步:
    *   存储库是通过 HTTPS 上的 Git 克隆/更新的.
    *   使用专用 API 端点通过 HTTPS 下载附件,LFS 对象和其他文件.

从用户执行 Git 操作的角度来看:

*   **主**节点的行为就像一个完整的读写 GitLab 实例.
*   **辅助**节点是只读的,但代理 Git 将操作推送到**主**节点. 这使得**辅助**节点似乎本身就支持推送操作.

为了简化该图,省略了一些必要的组件. 注意:

*   SSH 上的 Git 需要[`gitlab-shell`](https://gitlab.com/gitlab-org/gitlab-shell)和 OpenSSH.
*   通过 HTTPS 进行 Git 时需要[`gitlab-workhorse`](https://gitlab.com/gitlab-org/gitlab-workhorse) .

请注意, **辅助**节点需要两个不同的 PostgreSQL 数据库:

*   一个只读数据库实例,用于从 GitLab 主数据库中流式传输数据.
*   **辅助**节点在内部使用的[另一个数据库实例](#geo-tracking-database)记录已复制的数据.

**辅助**节点中,还有一个附加的守护进程: [Geo Log Cursor](#geo-log-cursor) .

## Requirements for running Geo[](#requirements-for-running-geo "Permalink")

要运行 Geo,必须具备以下条件:

*   支持 OpenSSH 6.9+的操作系统(需要[在数据库中快速查找授权的 SSH 密钥](../../operations/fast_ssh_key_lookup.html) )当前已知版本的 OpenSSH 随附了以下操作系统:
    *   [CentOS](https://www.centos.org) 7.4 以上
    *   [Ubuntu](https://ubuntu.com) 16.04 以上
*   PostgreSQL 11+ with [FDW](https://s0www0postgresql0org.icopy.site/docs/11/postgres-fdw.html) support and [Streaming Replication](https://wiki.postgresql.org/wiki/Streaming_Replication)
*   转到 2.9+
*   所有节点必须运行相同的 GitLab 版本.

此外,请检查 GitLab 的[最低要求](../../../install/requirements.html) ,我们建议您使用:

*   至少具有 GitLab 企业版 10.0 的基本地理功能.
*   最新版本以获得更好的体验.

### Firewall rules[](#firewall-rules "Permalink")

下表列出了在 Geo 的**主**节点和**辅助**节点之间必须打开的基本端口.

| **Primary** node | **Secondary** node | Protocol |
| --- | --- | --- |
| 80 | 80 | HTTP |
| 443 | 443 | TCP 或 HTTPS |
| 22 | 22 | TCP |
| 5432 |   | PostgreSQL |

[Package 默认值中](https://docs.gitlab.com/omnibus/package-information/defaults.html)查看 GitLab 使用的端口的完整列表

**注意:** [Web 终端](../../../ci/environments/index.html#web-terminals)支持要求您的负载平衡器正确处理 WebSocket 连接. 当使用 HTTP 或 HTTPS 代理,负载平衡器必须被配置为通过`Connection``Upgrade`逐跳头. 有关更多详细信息,请参见[Web 终端](../../integration/terminal.html)集成指南.**注意:**将 HTTPS 协议用于端口 443 时,您需要向负载均衡器添加 SSL 证书. 如果您想在 GitLab 应用程序服务器上终止 SSL,请使用 TCP 协议.

### LDAP[](#ldap "Permalink")

We recommend that if you use LDAP on your **primary** node, you also set up secondary LDAP servers on each **secondary** node. Otherwise, users will not be able to perform Git operations over HTTP(s) on the **secondary** node using HTTP Basic Authentication. However, Git via SSH and personal access tokens will still work.

**注意:**所有**辅助**节点都可以共享 LDAP 服务器,但是额外的延迟可能是一个问题. 另外,如果将**辅助**节点提升为**主要**节点,请考虑在[灾难恢复](../disaster_recovery/index.html)方案中将使用哪些 LDAP 服务器.

查看有关如何在 LDAP 服务中设置复制的说明. 根据使用的软件或服务,说明会有所不同. 例如,OpenLDAP 提供了[这些说明](https://www.openldap.org/doc/admin24/replication.html) .

### Geo Tracking Database[](#geo-tracking-database "Permalink")

跟踪数据库实例用作元数据,以控制需要在本地实例的磁盘上更新的内容. 例如:

*   下载新资产.
*   提取新的 LFS 对象.
*   从最近更新的存储库中获取更改.

因为复制的数据库实例是只读的,所以每个**辅助**节点都需要这个额外的数据库实例. 跟踪数据库需要`postgres_fdw`扩展名.

### Geo Log Cursor[](#geo-log-cursor "Permalink")

该守护程序:

*   读取由**主**节点复制到**辅助**数据库实例的事件的日志.
*   使用需要执行的更改更新地理跟踪数据库实例.

在跟踪数据库实例中将某些内容标记为要更新时,在**辅助**节点上运行的异步作业将执行所需的操作并更新状态.

这种新的体系结构使 GitLab 能够应对节点之间的连接问题. **辅助**节点与**主**节点断开连接的时间无关紧要,因为它将能够以正确的顺序重放所有事件并再次与**主**节点同步.

## Setup instructions[](#setup-instructions "Permalink")

这些说明假定您有一个 GitLab 的工作实例. 他们指导您:

1.  将现有实例设为**主要**节点.
2.  Adding **secondary** nodes.

**Caution:** The steps below should be followed in the order they appear. **确保所有节点上的 GitLab 版本均相同.**

### Using Omnibus GitLab[](#using-omnibus-gitlab "Permalink")

如果您使用 Omnibus 软件包安装了 GitLab(强烈建议):

1.  在将用作**辅助**节点的服务器上[安装 GitLab 企业版](https://about.gitlab.com/install/) . 不要创建帐户或登录到新的**辅助**节点.
2.**主**节点上[载 GitLab 许可](../../../user/admin_area/license.html)以解锁 Geo. 该许可证必须适用于[GitLab Premium](https://about.gitlab.com/pricing/)或更高版本.
3.  [Set up the database replication](database.html) (`primary (read-write) <-> secondary (read-only)` topology).
4.  [在数据库中配置快速查找授权的 SSH 密钥](../../operations/fast_ssh_key_lookup.html) . 此步骤是必需的,并且必须**同时**在**主**节点和**辅助**节点上完成.
5.  [配置 GitLab](configuration.html)以设置**主**节点和**辅助**节点.
6.  可选:为**辅助**节点[配置辅助 LDAP 服务器](../../auth/ldap/index.html) . 请参阅[LDAP 上的注释](#ldap) .
7.  [Follow the “Using a Geo Server” guide](using_a_geo_server.html).

## Post-installation documentation[](#post-installation-documentation "Permalink")

在**辅助**节点上安装 GitLab 并执行初始配置后,请参阅以下文档以获取安装后信息.

### Configuring Geo[](#configuring-geo "Permalink")

有关配置 Geo 的信息,请参见[Geo 配置](configuration.html) .

### Updating Geo[](#updating-geo "Permalink")

有关如何将 Geo 节点更新到最新的 GitLab 版本的信息,请参见[更新 Geo 节点](updating_the_geo_nodes.html) .

### Pausing and resuming replication[](#pausing-and-resuming-replication "Permalink")

[Introduced](https://gitlab.com/gitlab-org/gitlab/-/issues/35913) in [GitLab Premium](https://about.gitlab.com/pricing/) 13.2.

在某些情况下,例如在[升级](updating_the_geo_nodes.html)或[计划的故障转移](../disaster_recovery/planned_failover.html)期间,最好暂停主数据库和辅助数据库之间的复制.

暂停和恢复复制是通过辅助节点上的命令行工具完成的.

**暂停:(从中学开始)**

```
gitlab-ctl geo-replication-pause 
```

**恢复:(从中学开始)**

```
gitlab-ctl geo-replication-resume 
```

### Configuring Geo for multiple nodes[](#configuring-geo-for-multiple-nodes "Permalink")

有关为多个节点配置 Geo 的信息,请参阅[针对多个服务器的 Geo](multiple_servers.html) .

### Configuring Geo with Object Storage[](#configuring-geo-with-object-storage "Permalink")

有关配置带对象存储的 Geo 的信息,请参阅[带对象存储的 Geo](object_storage.html) .

### Disaster Recovery[](#disaster-recovery "Permalink")

有关在灾难恢复情况下使用 Geo 减轻数据丢失和恢复服务的信息,请参阅[灾难恢复](../disaster_recovery/index.html) .

### Replicating the Container Registry[](#replicating-the-container-registry "Permalink")

有关如何复制 Container Registry 的更多信息,请参阅[**辅助**节点的 Docker Registry](docker_registry.html) .

### Security Review[](#security-review "Permalink")

有关地理安全的更多信息,请参阅[地理安全审阅](security_review.html) .

### Tuning Geo[](#tuning-geo "Permalink")

有关调整 Geo 的更多信息,请参见[调整 Geo](tuning.html) .

### Set up a location-aware Git URL[](#set-up-a-location-aware-git-url "Permalink")

有关如何使用 AWS Route53 设置位置感知的 Git 远程 URL 的示例,请参阅使用 AWS Route53 [感知位置的 Git 远程 URL](location_aware_git_url.html) .

## Remove Geo node[](#remove-geo-node "Permalink")

For more information on removing a Geo node, see [Removing **secondary** Geo nodes](remove_geo_node.html).

## Disable Geo[](#disable-geo "Permalink")

要了解如何禁用地理位置,请参阅[禁用地理位置](disable_geo.html) .

## Current limitations[](#current-limitations "Permalink")

**注意:**此限制列表仅反映最新版本的 GitLab. 如果您使用的是旧版本,则可能存在其他限制.

*   将请求直接推送到**辅助**节点(对于 HTTP)或代理(对于 SSH)​​会将请求重定向到**主要**节点,而不是[直接处理它](https://gitlab.com/gitlab-org/gitlab/-/issues/1381) ,除非在 HTTP 中使用 Git over HTTP 并在 URI 中嵌入凭据. 例如, `https://user:password@secondary.tld` .
*   克隆,拉动或推送存在于**主**节点上但不存在于**辅助**节点上的存储库,这些存储库中的[选择性同步](configuration.html#selective-synchronization)不包括项目,因此不支持通过 SSH 进行, [但已计划进行支持](https://gitlab.com/groups/gitlab-org/-/epics/2562) . 支持 HTTP(S).
*   **主**节点必须在线才能进行 OAuth 登录. 现有会话和 Git 均不受影响. [正在计划](https://gitlab.com/gitlab-org/gitlab/-/issues/208465)支持**辅助**节点使用独立于主节点的 OAuth 提供程序.
*   安装过程需要执行多个手动步骤,根据具体情况,总共可能需要一个小时的时间. 我们正在努力改善这种体验. 有关详细信息,请参见[Omnibus GitLab 第 2978](https://gitlab.com/gitlab-org/omnibus-gitlab/-/issues/2978)期.
*   问题/合并请求的实时更新(例如,通过长轮询)在**辅助**节点上不起作用.
*   [选择性同步](configuration.html#selective-synchronization)仅适用于文件和存储库. 其他数据集已完全复制到**辅助**节点,使其不适合用作访问控制机制.
*   用于分支项目重复数据删除的对象池仅在**主**节点上工作,并在**辅助**节点上重复.
*   [如果外部合并请求差异](../../merge_request_diffs.html)在磁盘上,则将不会复制它们,并且查看合并请求将失败. 但是,支持对象存储**中的**外部 MR 差异. 默认配置(数据库中)起作用.
*   GitLab Runners 无法向**辅助**节点注册. [计划在将来](https://gitlab.com/gitlab-org/gitlab/-/issues/3294)对此提供支持.

### Limitations on replication/verification[](#limitations-on-replicationverification "Permalink")

您可以跟踪实现这些史诗/问题中缺少的项目的进度:

*   [Unreplicated Data Types](https://gitlab.com/groups/gitlab-org/-/epics/893)
*   [Verify all replicated data](https://gitlab.com/groups/gitlab-org/-/epics/1430)

这里有所有 GitLab [数据类型](datatypes.html)的完整列表以及[对复制和验证的现有支持](datatypes.html#limitations-on-replicationverification) .

## Frequently Asked Questions[](#frequently-asked-questions "Permalink")

有关常见问题的答案,请参见[地理位置常见问题解答](faq.html) .

## Log files[](#log-files "Permalink")

自 GitLab 9.5 起,Geo 将结构化日志消息存储在`geo.log`文件中. 对于 Omnibus 安装,此文件位于`/var/log/gitlab/gitlab-rails/geo.log` .

该文件包含有关 Geo 何时尝试同步存储库和文件的信息. 文件中的每一行都包含一个可以提取的单独的 JSON 条目. 例如,Elasticsearch 或 Splunk.

例如:

```
{"severity":"INFO","time":"2017-08-06T05:40:16.104Z","message":"Repository update","project_id":1,"source":"repository","resync_repository":true,"resync_wiki":true,"class":"Gitlab::Geo::LogCursor::Daemon","cursor_delay_s":0.038} 
```

此消息表明,Geo 检测到项目`1`需要存储库更新.

## Troubleshooting[](#troubleshooting "Permalink")

有关故障排除步骤,请参阅[地理故障排除](troubleshooting.html) .