提交 872751b2 编写于 作者: B BayoNet 提交者: alexey-milovidov

input_format_allow_errors_num and input_format_allow_errors_ratio are described.

上级 48d85af4
......@@ -2,6 +2,7 @@
==========
Описанные в разделе настройки могут быть заданы следующими способами:
* Глобально.
В конфигурационных файлах сервера.
......
......@@ -42,6 +42,34 @@ fallback_to_stale_replicas_for_distributed_queries
По умолчанию - 1 (включена).
input_format_allow_errors_num
-----------------------------
Устанавливает максимальное количество допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.п.).
Значение по умолчанию - 0.
Используйте обязательно в паре с ``input_format_allow_errors_ratio``, значения обеих настроек должны быть больше 0.
Если при чтении строки возникла ошибка, но при этом счетчик ошибок меньше ``input_format_allow_errors_num``, то ClickHouse игнорирует строку и переходит к следующей.
В случае превышения ``input_format_allow_errors_num`` ClickHouse генерирует исключение.
input_format_allow_errors_ratio
-------------------------------
Устанавливает максимальный процент допустимых ошибок при чтении из текстовых форматов (CSV, TSV и т.п.).
Значение по умолчанию - 0.
Используйте обязательно в паре с ``input_format_allow_errors_num``, значения обеих настроек должны быть больше 0.
Если при чтении строки возникла ошибка, но при этом текущий процент ошибок меньше ``input_format_allow_ratio_num``, то ClickHouse игнорирует строку и переходит к следующей.
В случае превышения ``input_format_allow_errors_ratio`` ClickHouse генерирует исключение.
max_block_size
--------------
Данные в ClickHouse обрабатываются по блокам (наборам кусочков столбцов). Внутренние циклы обработки одного блока достаточно эффективны, но при этом существуют заметные издержки на каждый блок. ``max_block_size`` - это рекомендация, какого размера блоки (в количестве строк) загружать из таблицы. Размер блока должен быть не слишком маленьким, чтобы издержки на каждый блок оставались незаметными, и не слишком большим, чтобы запрос с LIMIT-ом, который завершается уже после первого блока, выполнялся быстро; чтобы не использовалось слишком много оперативки при вынимании большого количества столбцов в несколько потоков; чтобы оставалась хоть какая-нибудь кэш-локальность.
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册