From 872751b2bb67ba1c6e2d6859a2926512545afb55 Mon Sep 17 00:00:00 2001 From: BayoNet Date: Mon, 22 May 2017 14:36:49 +0300 Subject: [PATCH] input_format_allow_errors_num and input_format_allow_errors_ratio are described. --- docs/ru/settings/index.rst | 1 + docs/ru/settings/settings.rst | 28 ++++++++++++++++++++++++++++ 2 files changed, 29 insertions(+) diff --git a/docs/ru/settings/index.rst b/docs/ru/settings/index.rst index aa51d89e26..6def0b3875 100644 --- a/docs/ru/settings/index.rst +++ b/docs/ru/settings/index.rst @@ -2,6 +2,7 @@ ========== Описанные в разделе настройки могут быть заданы следующими способами: + * Глобально. В конфигурационных файлах сервера. diff --git a/docs/ru/settings/settings.rst b/docs/ru/settings/settings.rst index 4d0c54fccd..f21e7da299 100644 --- a/docs/ru/settings/settings.rst +++ b/docs/ru/settings/settings.rst @@ -42,6 +42,34 @@ fallback_to_stale_replicas_for_distributed_queries По умолчанию - 1 (включена). + +input_format_allow_errors_num +----------------------------- +Устанавливает максимальное количество допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.п.). + +Значение по умолчанию - 0. + +Используйте обязательно в паре с ``input_format_allow_errors_ratio``, значения обеих настроек должны быть больше 0. + +Если при чтении строки возникла ошибка, но при этом счетчик ошибок меньше ``input_format_allow_errors_num``, то ClickHouse игнорирует строку и переходит к следующей. + +В случае превышения ``input_format_allow_errors_num`` ClickHouse генерирует исключение. + + +input_format_allow_errors_ratio +------------------------------- +Устанавливает максимальный процент допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.п.). + +Значение по умолчанию - 0. + +Используйте обязательно в паре с ``input_format_allow_errors_num``, значения обеих настроек должны быть больше 0. + +Если при чтении строки возникла ошибка, но при этом текущий процент ошибок меньше ``input_format_allow_ratio_num``, то ClickHouse игнорирует строку и переходит к следующей. + +В случае превышения ``input_format_allow_errors_ratio`` ClickHouse генерирует исключение. + + + max_block_size -------------- Данные в ClickHouse обрабатываются по блокам (наборам кусочков столбцов). Внутренние циклы обработки одного блока достаточно эффективны, но при этом существуют заметные издержки на каждый блок. ``max_block_size`` - это рекомендация, какого размера блоки (в количестве строк) загружать из таблицы. Размер блока должен быть не слишком маленьким, чтобы издержки на каждый блок оставались незаметными, и не слишком большим, чтобы запрос с LIMIT-ом, который завершается уже после первого блока, выполнялся быстро; чтобы не использовалось слишком много оперативки при вынимании большого количества столбцов в несколько потоков; чтобы оставалась хоть какая-нибудь кэш-локальность. -- GitLab