input_format_allow_errors_num and input_format_allow_errors_ratio are described.

872751b2 · BayoNet · alexey-milovidov · 48d85af4 · 872751b2 · 872751b2
隐藏空白更改
内联并排

Showing with 29 addition and 0 deletion

docs/ru/settings/index.rst docs/ru/settings/index.rst +1 -0

docs/ru/settings/settings.rst docs/ru/settings/settings.rst +28 -0

未找到文件。
--- a/docs/ru/settings/index.rst
+++ b/docs/ru/settings/index.rst
@@ -2,6 +2,7 @@
 ==========

 Описанные в разделе настройки могут быть заданы следующими способами:
+
 * Глобально.
  
  В конфигурационных файлах сервера.

--- a/docs/ru/settings/settings.rst
+++ b/docs/ru/settings/settings.rst
@@ -42,6 +42,34 @@ fallback_to_stale_replicas_for_distributed_queries

 По умолчанию - 1 (включена).

+
+input_format_allow_errors_num
+-----------------------------
+Устанавливает максимальное количество допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.п.).
+
+Значение по умолчанию - 0.
+
+Используйте обязательно в паре с ``input_format_allow_errors_ratio``, значения обеих настроек должны быть больше 0.
+
+Если при чтении строки возникла ошибка, но при этом счетчик ошибок меньше ``input_format_allow_errors_num``, то ClickHouse игнорирует строку и переходит к следующей.
+
+В случае превышения ``input_format_allow_errors_num`` ClickHouse генерирует исключение.
+
+
+input_format_allow_errors_ratio
+-------------------------------
+Устанавливает максимальный процент допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.п.).
+
+Значение по умолчанию - 0.
+
+Используйте обязательно в паре с ``input_format_allow_errors_num``, значения обеих настроек должны быть больше 0.
+
+Если при чтении строки возникла ошибка, но при этом текущий процент ошибок меньше ``input_format_allow_ratio_num``, то ClickHouse игнорирует строку и переходит к следующей.
+
+В случае превышения ``input_format_allow_errors_ratio`` ClickHouse генерирует исключение.
+
+
+
 max_block_size
 --------------
 Данные в ClickHouse обрабатываются по блокам (наборам кусочков столбцов). Внутренние циклы обработки одного блока достаточно эффективны, но при этом существуют заметные издержки на каждый блок. ``max_block_size`` - это рекомендация, какого размера блоки (в количестве строк) загружать из таблицы. Размер блока должен быть не слишком маленьким, чтобы издержки на каждый блок оставались незаметными, и не слишком большим, чтобы запрос с LIMIT-ом, который завершается уже после первого блока, выполнялся быстро; чтобы не использовалось слишком много оперативки при вынимании большого количества столбцов в несколько потоков; чтобы оставалась хоть какая-нибудь кэш-локальность.