Устанавливает максимальное количество допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.п.).
Значение по умолчанию - 0.
Используйте обязательно в паре с ``input_format_allow_errors_ratio``, значения обеих настроек должны быть больше 0.
Если при чтении строки возникла ошибка, но при этом счетчик ошибок меньше ``input_format_allow_errors_num``, то ClickHouse игнорирует строку и переходит к следующей.
В случае превышения ``input_format_allow_errors_num`` ClickHouse генерирует исключение.
input_format_allow_errors_ratio
-------------------------------
Устанавливает максимальный процент допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.п.).
Значение по умолчанию - 0.
Используйте обязательно в паре с ``input_format_allow_errors_num``, значения обеих настроек должны быть больше 0.
Если при чтении строки возникла ошибка, но при этом текущий процент ошибок меньше ``input_format_allow_ratio_num``, то ClickHouse игнорирует строку и переходит к следующей.
В случае превышения ``input_format_allow_errors_ratio`` ClickHouse генерирует исключение.
max_block_size
--------------
Данные в ClickHouse обрабатываются по блокам (наборам кусочков столбцов). Внутренние циклы обработки одного блока достаточно эффективны, но при этом существуют заметные издержки на каждый блок. ``max_block_size`` - это рекомендация, какого размера блоки (в количестве строк) загружать из таблицы. Размер блока должен быть не слишком маленьким, чтобы издержки на каждый блок оставались незаметными, и не слишком большим, чтобы запрос с LIMIT-ом, который завершается уже после первого блока, выполнялся быстро; чтобы не использовалось слишком много оперативки при вынимании большого количества столбцов в несколько потоков; чтобы оставалась хоть какая-нибудь кэш-локальность.