diff --git a/docs/ru/settings/index.rst b/docs/ru/settings/index.rst index aa51d89e264289eb47ceccb3c59bdf921834777f..6def0b387536c50533565fc28edcc973d94ed443 100644 --- a/docs/ru/settings/index.rst +++ b/docs/ru/settings/index.rst @@ -2,6 +2,7 @@ ========== Описанные в разделе настройки могут быть заданы следующими способами: + * Глобально. В конфигурационных файлах сервера. diff --git a/docs/ru/settings/settings.rst b/docs/ru/settings/settings.rst index 4d0c54fccd61e4e1d30dd2c372ee16d3fbc1e4a1..f21e7da2993c958cfd680e8eed9b7637a962541d 100644 --- a/docs/ru/settings/settings.rst +++ b/docs/ru/settings/settings.rst @@ -42,6 +42,34 @@ fallback_to_stale_replicas_for_distributed_queries По умолчанию - 1 (включена). + +input_format_allow_errors_num +----------------------------- +Устанавливает максимальное количество допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.п.). + +Значение по умолчанию - 0. + +Используйте обязательно в паре с ``input_format_allow_errors_ratio``, значения обеих настроек должны быть больше 0. + +Если при чтении строки возникла ошибка, но при этом счетчик ошибок меньше ``input_format_allow_errors_num``, то ClickHouse игнорирует строку и переходит к следующей. + +В случае превышения ``input_format_allow_errors_num`` ClickHouse генерирует исключение. + + +input_format_allow_errors_ratio +------------------------------- +Устанавливает максимальный процент допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.п.). + +Значение по умолчанию - 0. + +Используйте обязательно в паре с ``input_format_allow_errors_num``, значения обеих настроек должны быть больше 0. + +Если при чтении строки возникла ошибка, но при этом текущий процент ошибок меньше ``input_format_allow_ratio_num``, то ClickHouse игнорирует строку и переходит к следующей. + +В случае превышения ``input_format_allow_errors_ratio`` ClickHouse генерирует исключение. + + + max_block_size -------------- Данные в ClickHouse обрабатываются по блокам (наборам кусочков столбцов). Внутренние циклы обработки одного блока достаточно эффективны, но при этом существуют заметные издержки на каждый блок. ``max_block_size`` - это рекомендация, какого размера блоки (в количестве строк) загружать из таблицы. Размер блока должен быть не слишком маленьким, чтобы издержки на каждый блок оставались незаметными, и не слишком большим, чтобы запрос с LIMIT-ом, который завершается уже после первого блока, выполнялся быстро; чтобы не использовалось слишком много оперативки при вынимании большого количества столбцов в несколько потоков; чтобы оставалась хоть какая-нибудь кэш-локальность.