DOCAPI-7444: RU <-> EN docs regular sync. (#5944)

* DOCAPI-7444: RU <-> EN docs regular sync.

DOCAPI-7444: RU <-> EN docs regular sync. (#5944)
* DOCAPI-7444: RU <-> EN docs regular sync.
d48995f1 · BayoNet · GitHub · 83c8d487 · d48995f1 · d48995f1
15 changed file
--- a/docs/en/operations/server_settings/settings.md
+++ b/docs/en/operations/server_settings/settings.md
@@ -514,7 +514,7 @@ Use the following parameters to configure logging:
 ```


-## path
+## path {#server_settings-path}

 The path to the directory containing data.


--- a/docs/en/operations/table_engines/file.md
+++ b/docs/en/operations/table_engines/file.md
@@ -71,7 +71,7 @@ $ echo -e "1,2\n3,4" | clickhouse-local -q "CREATE TABLE table (a Int64, b Int64

 ## Details of Implementation

- Multiple SELECT queries can be performed concurrently, but INSERT queries will wait each other.
+- Multiple `SELECT` queries can be performed concurrently, but `INSERT` queries will wait each other.
 - Not supported:
  - `ALTER`
  - `SELECT ... SAMPLE`

--- a/docs/en/query_language/agg_functions/combinators.md
+++ b/docs/en/query_language/agg_functions/combinators.md
@@ -22,13 +22,21 @@ Example 2: `uniqArray(arr)` – Count the number of unique elements in all 'arr'

 ## -State

-If you apply this combinator, the aggregate function doesn't return the resulting value (such as the number of unique values for the `uniq` function), but an intermediate state of the aggregation (for `uniq`, this is the hash table for calculating the number of unique values). This is an AggregateFunction(...) that can be used for further processing or stored in a table to finish aggregating later. To work with these states, use the [AggregatingMergeTree](../../operations/table_engines/aggregatingmergetree.md) table engine, the functions [`finalizeAggregation`](../functions/other_functions.md#finalizeaggregation) and [`runningAccumulate`](../functions/other_functions.md#function-runningaccumulate), and the combinators -Merge and -MergeState described below.
+If you apply this combinator, the aggregate function doesn't return the resulting value (such as the number of unique values for the [uniq](reference.md#agg_function-uniq) function), but an intermediate state of the aggregation (for `uniq`, this is the hash table for calculating the number of unique values). This is an `AggregateFunction(...)` that can be used for further processing or stored in a table to finish aggregating later.

-## -Merge
+To work with these states, use:
+
+- [AggregatingMergeTree](../../operations/table_engines/aggregatingmergetree.md) table engine.
+- [finalizeAggregation](../functions/other_functions.md#function-finalizeaggregation) function.
+- [runningAccumulate](../functions/other_functions.md#function-runningaccumulate) function.
+- [-Merge](#aggregate_functions_combinators_merge) combinator.
+- [-MergeState](#aggregate_functions_combinators_mergestate) combinator.
+
+## -Merge {#aggregate_functions_combinators_merge}

 If you apply this combinator, the aggregate function takes the intermediate aggregation state as an argument, combines the states to finish aggregation, and returns the resulting value.

-## -MergeState.
+## -MergeState {#aggregate_functions_combinators_mergestate}

 Merges the intermediate aggregation states in the same way as the -Merge combinator. However, it doesn't return the resulting value, but an intermediate aggregation state, similar to the -State combinator.


--- a/docs/en/query_language/functions/geo.md
+++ b/docs/en/query_language/functions/geo.md
@@ -151,4 +151,36 @@ SELECT geohashDecode('ezs42') AS res
 └─────────────────────────────────┘
 ```

+## geoToH3
+
+Calculates [H3](https://uber.github.io/h3/#/documentation/overview/introduction) point index `(lon, lat)` with specified resolution.
+
+```
+geoToH3(lon, lat, resolution)
+```
+
+**Input values**
+
+- `lon` — Longitude. Type: [Float64](../../data_types/float.md).
+- `lat` — Latitude. Type: [Float64](../../data_types/float.md).
+- `resolution` — Index resolution. Range: `[0, 15]`. Type: [UInt8](../../data_types/int_uint.md).
+
+**Returned values**
+
+- Hexagon index number.
+- 0 in case of error.
+
+Type: [UInt64](../../data_types/int_uint.md).
+
+**Example**
+
+``` sql
+SELECT geoToH3(37.79506683, 55.71290588, 15) as h3Index
+```
+```
+┌────────────h3Index─┐
+│ 644325524701193974 │
+└────────────────────┘
+```
+
 [Original article](https://clickhouse.yandex/docs/en/query_language/functions/geo/) <!--hide-->
--- a/docs/en/query_language/functions/other_functions.md
+++ b/docs/en/query_language/functions/other_functions.md
@@ -627,15 +627,36 @@ SELECT replicate(1, ['a', 'b', 'c'])
 └───────────────────────────────┘
 ```

-## filesystemAvailable
+## filesystemAvailable {#function-filesystemavailable}

-Returns the remaining space information of the disk, in bytes. This information is evaluated using the configured by path.
+Returns the amount of remaining space in the filesystem where the files of the databases located. See the [path](../../operations/server_settings/settings.md#server_settings-path) server setting description.
+
+```
+filesystemAvailable()
+```
+
+**Returned values**
+
+- Amount of remaining space in bytes.
+
+Type: [UInt64](../../data_types/int_uint.md).
+
+**Example**
+
+```sql
+SELECT filesystemAvailable() AS "Free space", toTypeName(filesystemAvailable()) AS "Type"
+```
+```text
+┌──Free space─┬─Type───┐
+│ 18152624128 │ UInt64 │
+└─────────────┴────────┘
+```

 ## filesystemCapacity

 Returns the capacity information of the disk, in bytes. This information is evaluated using the configured by path.

-## finalizeAggregation
+## finalizeAggregation {#function-finalizeaggregation}

 Takes state of aggregate function. Returns result of aggregation (finalized state).


--- a/docs/ru/getting_started/example_datasets/star_schema.md
+++ b/docs/ru/getting_started/example_datasets/star_schema.md
@@ -101,11 +101,11 @@ CREATE TABLE lineorder_flat
 ENGINE = MergeTree
 PARTITION BY toYear(LO_ORDERDATE)
 ORDER BY (LO_ORDERDATE, LO_ORDERKEY) AS
-SELECT *
-FROM lineorder
-ANY INNER JOIN customer ON LO_CUSTKEY = C_CUSTKEY
-ANY INNER JOIN supplier ON LO_SUPPKEY = S_SUPPKEY
-ANY INNER JOIN part ON LO_PARTKEY = P_PARTKEY;
+SELECT l.*, c.*, s.*, p.*
+FROM lineorder l
+ ANY INNER JOIN customer c ON (c.C_CUSTKEY = l.LO_CUSTKEY)
+ ANY INNER JOIN supplier s ON (s.S_SUPPKEY = l.LO_SUPPKEY)
+ ANY INNER JOIN part p ON  (p.P_PARTKEY = l.LO_PARTKEY);

 ALTER TABLE lineorder_flat DROP COLUMN C_CUSTKEY, DROP COLUMN S_SUPPKEY, DROP COLUMN P_PARTKEY;
 ```

--- a/docs/ru/interfaces/formats.md
+++ b/docs/ru/interfaces/formats.md
@@ -165,6 +165,8 @@ clickhouse-client --format_csv_delimiter="|" --query="INSERT INTO test.csv FORMA

 При парсинге, все значения могут парситься как в кавычках, так и без кавычек. Поддерживаются как двойные, так и одинарные кавычки. Строки также могут быть без кавычек. В этом случае они парсятся до символа-разделителя или перевода строки (CR или LF). В нарушение RFC, в случае парсинга строк не в кавычках, начальные и конечные пробелы и табы игнорируются. В качестве перевода строки, поддерживаются как Unix (LF), так и Windows (CR LF) и Mac OS Classic (LF CR) варианты.

+Если установлена настройка [input_format_defaults_for_omitted_fields = 1](../operations/settings/settings.md#session_settings-input_format_defaults_for_omitted_fields), то пустые значения без кавычек заменяются значениями по умолчанию для типа данных столбца.
+
 `NULL` форматируется в виде `\N`.

 Формат CSV поддерживает вывод totals и extremes аналогично `TabSeparated`.

--- a/docs/ru/operations/server_settings/settings.md
+++ b/docs/ru/operations/server_settings/settings.md
@@ -514,7 +514,7 @@ ClickHouse проверит условия `min_part_size` и `min_part_size_rat
 ```


-## path
+## path {#server_settings-path}

 Путь к каталогу с данными.


--- a/docs/ru/operations/settings/settings.md
+++ b/docs/ru/operations/settings/settings.md
@@ -181,20 +181,15 @@ Ok.

 ## input_format_defaults_for_omitted_fields {#session_settings-input_format_defaults_for_omitted_fields}

-Включает/выключает расширенный обмен данными между клиентом ClickHouse и сервером ClickHouse. Параметр применяется для запросов `INSERT`.
+При вставке данных запросом `INSERT`, заменяет пропущенные поля значениям по умолчанию для типа данных столбца.

-При выполнении запроса`INSERT`, клиент ClickHouse подготавливает данные и отправляет их на сервер для записи. При подготовке данных клиент получает структуру таблицы от сервера. В некоторых случаях клиенту требуется больше информации, чем сервер отправляет по умолчанию. Включите расширенный обмен данными с помощью настройки `input_format_defaults_for_omitted_fields = 1`.
+Поддерживаемые форматы вставки:

-Если расширенный обмен данными включен, сервер отправляет дополнительные метаданные вместе со структурой таблицы. Состав метаданных зависит от операции.
-
-Операции, для которых может потребоваться включить расширенный обмен данными:
-
- Вставка данных в формате [JSONEachRow](../../interfaces/formats.md#jsoneachrow).
-
-Для всех остальных операций ClickHouse не применяет этот параметр.
+- [JSONEachRow](../../interfaces/formats.md#jsoneachrow)
+- [CSV](../../interfaces/formats.md#csv)

 !!! note "Примечание"
-    Функциональность расширенного обмена данными потребляет дополнительные вычислительные ресурсы на сервере и может снизить производительность.
+    Когда опция включена, сервер отправляет клиенту расширенные метаданные. Это требует дополнительных вычислительных ресурсов на сервере и может снизить производительность.

 Возможные значения:


--- a/docs/ru/operations/table_engines/file.md
+++ b/docs/ru/operations/table_engines/file.md
@@ -68,7 +68,7 @@ $ echo -e "1,2\n3,4" | clickhouse-local -q "CREATE TABLE table (a Int64, b Int64

 ## Детали реализации

- Поддерживается многопоточное чтение и однопоточная запись.
+- Поддерживается одновременное выполнение множества запросов `SELECT`, запросы `INSERT` могут выполняться только последовательно.
 - Не поддерживается:
    - использование операций `ALTER` и `SELECT...SAMPLE`;
    - индексы;

--- a/docs/ru/operations/table_engines/kafka.md
+++ b/docs/ru/operations/table_engines/kafka.md
@@ -25,7 +25,7 @@ SETTINGS
    [kafka_row_delimiter = 'delimiter_symbol',]
    [kafka_schema = '',]
    [kafka_num_consumers = N,]
-    [kafka_skip_broken_messages = <0|1>]
+    [kafka_skip_broken_messages = N]
 ```

 Обязательные параметры:
@@ -40,7 +40,7 @@ SETTINGS
 - `kafka_row_delimiter` – символ-разделитель записей (строк), которым завершается сообщение.
 - `kafka_schema` – опциональный параметр, необходимый, если используется формат, требующий определения схемы. Например, [Cap'n Proto](https://capnproto.org/) требует путь к файлу со схемой и название корневого объекта `schema.capnp:Message`.
 - `kafka_num_consumers` – количество потребителей (consumer) на таблицу. По умолчанию: `1`. Укажите больше потребителей, если пропускная способность одного потребителя недостаточна. Общее число потребителей не должно превышать количество партиций в топике, так как на одну партицию может быть назначено не более одного потребителя.
- `kafka_skip_broken_messages` – режим обработки сообщений Kafka. Если `kafka_skip_broken_messages = 1`, то движок отбрасывает сообщения Кафки, которые не получилось обработать. Одно сообщение в точности соответствует одной записи (строке).
+- `kafka_skip_broken_messages` – максимальное количество некорректных сообщений в блоке. Если `kafka_skip_broken_messages = N`, то движок отбрасывает `N` сообщений Кафки, которые не получилось обработать. Одно сообщение в точности соответствует одной записи (строке). Значение по умолчанию – 0.

 Примеры


--- a/docs/ru/query_language/agg_functions/combinators.md
+++ b/docs/ru/query_language/agg_functions/combinators.md
@@ -23,13 +23,22 @@

 ## -State

-В случае применения этого комбинатора, агрегатная функция возвращает не готовое значение (например, в случае функции `uniq` — количество уникальных значений), а промежуточное состояние агрегации (например, в случае функции `uniq` — хэш-таблицу для расчёта количества уникальных значений), которое имеет тип AggregateFunction(...) и может использоваться для дальнейшей обработки или может быть сохранено в таблицу для последующей доагрегации - смотрите разделы «AggregatingMergeTree» и «функции для работы с промежуточными состояниями агрегации».
+В случае применения этого комбинатора, агрегатная функция возвращает не готовое значение (например, в случае функции [uniq](reference.md#agg_function-uniq) — количество уникальных значений), а промежуточное состояние агрегации (например, в случае функции `uniq` — хэш-таблицу для расчёта количества уникальных значений), которое имеет тип `AggregateFunction(...)` и может использоваться для дальнейшей обработки или может быть сохранено в таблицу для последующей доагрегации.

-## -Merge
+Для работы с промежуточными состояниями предназначены:
+
+- Движок таблиц [AggregatingMergeTree](../../operations/table_engines/aggregatingmergetree.md).
+- Функция [finalizeAggregation](../functions/other_functions.md#function-finalizeaggregation).
+- Функция [runningAccumulate](../functions/other_functions.md#function-runningaccumulate).
+- Комбинатор [-Merge](#aggregate_functions_combinators_merge).
+- Комбинатор [-MergeState](#aggregate_functions_combinators_mergestate).
+
+
+## -Merge {#aggregate_functions_combinators_merge}

 В случае применения этого комбинатора, агрегатная функция будет принимать в качестве аргумента промежуточное состояние агрегации, доагрегировать (объединять вместе) эти состояния, и возвращать готовое значение.

-## -MergeState.
+## -MergeState {#aggregate_functions_combinators_mergestate}

 Выполняет слияние промежуточных состояний агрегации, аналогично комбинатору -Merge, но возвращает не готовое значение, а промежуточное состояние агрегации, аналогично комбинатору -State.


--- a/docs/ru/query_language/functions/geo.md
+++ b/docs/ru/query_language/functions/geo.md
@@ -132,13 +132,17 @@ SELECT geohashEncode(-5.60302734375, 42.593994140625, 0) AS res

 Декодирует любую строку, закодированную в geohash, на долготу и широту.

+```
+geohashDecode(geohash_string)
+```
+
 **Входные значения**

- encoded string — строка, содержащая geohash.
+- `geohash_string` — строка, содержащая geohash.

 **Возвращаемые значения**

- (longitude, latitude) — широта и долгота. Кортеж из двух значений типа `Float64`.
+- `(longitude, latitude)` — широта и долгота. Кортеж из двух значений типа `Float64`.

 **Пример**

@@ -154,7 +158,7 @@ SELECT geohashDecode('ezs42') AS res

 ## geoToH3

-Получает H3 индекс точки (lon, lat) с заданным разрешением
+Получает H3 индекс точки `(lon, lat)` с заданным разрешением

 ```
 geoToH3(lon, lat, resolution)
@@ -162,15 +166,16 @@ geoToH3(lon, lat, resolution)

 **Входные значения**

- `lon` - географическая долгота. Тип данных — [Float64](../../data_types/float.md).
- `lat` - географическая широта. Тип данных — [Float64](../../data_types/float.md).
- `resolution` - требуемое разрешение индекса. Тип данных — [UInt8](../../data_types/int_uint.md). Диапазон возможных значение — `[0, 15]`.
+- `lon` — географическая долгота. Тип данных — [Float64](../../data_types/float.md).
+- `lat` — географическая широта. Тип данных — [Float64](../../data_types/float.md).
+- `resolution` — требуемое разрешение индекса. Тип данных — [UInt8](../../data_types/int_uint.md). Диапазон возможных значений — `[0, 15]`.

 **Возвращаемые значения**

-Возвращает значение с типом [UInt64] (../../data_types/int_uint.md).
-`0` в случае ошибки.
-Иначе возвращается индексный номер шестиугольника.
+- Порядковый номер шестиугольника.
+- 0 в случае ошибки.
+
+Тип — [UInt64](../../data_types/int_uint.md).

 **Пример**


--- a/docs/ru/query_language/functions/other_functions.md
+++ b/docs/ru/query_language/functions/other_functions.md
@@ -600,6 +600,39 @@ SELECT replicate(1, ['a', 'b', 'c'])
 └───────────────────────────────┘
 ```

+## filesystemAvailable {#function-filesystemavailable}
+
+Возвращает объем оставшегося места в файловой системе, в которой расположены файлы баз данных. Смотрите описание конфигурационного параметра сервера  [path](../../operations/server_settings/settings.md#server_settings-path).
+
+```
+filesystemAvailable()
+```
+
+**Возвращаемое значение**
+
+- Объем свободного места.
+
+Тип — [UInt64](../../data_types/int_uint.md).
+
+**Пример**
+
+```sql
+SELECT filesystemAvailable() AS "Free space", toTypeName(filesystemAvailable()) AS "Type"
+```
+```text
+┌──Free space─┬─Type───┐
+│ 18152624128 │ UInt64 │
+└─────────────┴────────┘
+```
+
+## filesystemCapacity
+
+Возвращает данные о ёмкости диска.
+
+## finalizeAggregation {#function-finalizeaggregation}
+
+Принимает состояние агрегатной функции. Возвращает результат агрегирования.
+
 ## runningAccumulate {#function-runningaccumulate}

 Принимает на вход состояния агрегатной функции и возвращает столбец со значениями, которые представляют собой результат мёржа этих состояний для выборки строк из блока от первой до текущей строки. Например, принимает состояние агрегатной функции (например,  `runningAccumulate(uniqState(UserID))`), и для каждой строки блока возвращает результат агрегатной функции после мёржа состояний функции для всех предыдущих строк и текущей. Таким образом, результат зависит от разбиения данных по блокам и от порядка данных в блоке.

--- a/docs/zh/query_language/functions/other_functions.md
+++ b/docs/zh/query_language/functions/other_functions.md
@@ -637,7 +637,7 @@ SELECT replicate(1, ['a', 'b', 'c'])

 返回磁盘的容量信息，以字节为单位。使用配置文件中的path配置评估此信息。

-## finalizeAggregation
+## finalizeAggregation {#function-finalizeaggregation}

 获取聚合函数的状态。返回聚合结果（最终状态）。