......@@ -248,7 +248,7 @@ public:
return summary.back().mean;
/** Get multiple quantiles (`size` pieces).
/** Get multiple quantiles (`size` parts).
* levels - an array of levels of the desired quantiles. They are in a random order.
* levels_permutation - array-permutation levels. The i-th position will be the index of the i-th ascending level in the `levels` array.
* result - the array where the results are added, in order of `levels`,
......@@ -6,7 +6,7 @@
namespace DB
/// Операция из запроса ALTER (кроме манипуляции с PART/PARTITION). Добавление столбцов типа Nested не развернуто в добавление отдельных столбцов.
/// Operation from the ALTER query (except for manipulation with PART/PARTITION). Adding Nested columns is not expanded to add individual columns.
struct AlterCommand
enum Type
......@@ -24,19 +24,19 @@ struct AlterCommand
String partition_name;
/// Для ADD и MODIFY - новый тип столбца.
/// For ADD and MODIFY, a new column type.
DataTypePtr data_type;
ColumnDefaultType default_type{};
ASTPtr default_expression{};
/// Для ADD - после какого столбца добавить новый. Если пустая строка, добавить в конец. Добавить в начало сейчас нельзя.
/// For ADD - after which column to add a new one. If an empty string, add to the end. To add to the beginning now it is impossible.
String after_column;
ASTPtr primary_key;
/// одинаковыми считаются имена, если они совпадают целиком или name_without_dot совпадает с частью имени до точки
/// the names are the same if they match the whole name or name_without_dot matches the part of the name up to the dot
static bool namesEqual(const String & name_without_dot, const DB::NameAndTypePair & name_type)
String name_with_dot = name_without_dot + ".";
......@@ -15,19 +15,19 @@ namespace ErrorCodes
/** Позволяет выбрать метод сжатия по указанным в конфигурационном файле условиям.
* Конфиг выглядит примерно так:
/** Allows you to select the compression method for the conditions specified in the configuration file.
* The config looks like this
<!-- Набор вариантов. Варианты проверяются подряд. Побеждает последний сработавший вариант. Если ни один не сработал, то используется lz4. -->
<!-- Set of options. Options are checked in a row. The last worked option wins. If none has worked, then lz4 is used. -->
<!-- Условия. Должны сработать одновременно все. Часть условий могут быть не указаны. -->
<min_part_size>10000000000</min_part_size> <!-- Минимальный размер куска в байтах. -->
<min_part_size_ratio>0.01</min_part_size_ratio> <!-- Минимальный размер куска относительно всех данных таблицы. -->
<!-- Conditions. All must be satisfied simultaneously. Some conditions may not be specified. -->
<min_part_size>10000000000</min_part_size> <!-- The minimum size of a part in bytes. -->
<min_part_size_ratio>0.01</min_part_size_ratio> <!-- The minimum size of the part relative to all the data in the table. -->
<!-- Какой метод сжатия выбрать. -->
<! - Which compression method to choose. ->
......@@ -73,7 +73,7 @@ private:
std::vector<Element> elements;
CompressionMethodSelector() {} /// Всегда возвращает метод по-умолчанию.
CompressionMethodSelector() {} /// Always returns the default method.
CompressionMethodSelector(Poco::Util::AbstractConfiguration & config, const std::string & config_prefix)
......@@ -10,14 +10,14 @@ namespace DB
class StorageDistributed;
/** Запись асинхронная - данные сначала записываются на локальную файловую систему, а потом отправляются на удалённые серверы.
* Если Distributed таблица использует более одного шарда, то для того, чтобы поддерживалась запись,
* при создании таблицы должен быть указан дополнительный параметр у ENGINE - ключ шардирования.
* Ключ шардирования - произвольное выражение от столбцов. Например, rand() или UserID.
* При записи блок данных разбивается по остатку от деления ключа шардирования на суммарный вес шардов,
* и полученные блоки пишутся в сжатом Native формате в отдельные директории для отправки.
* Для каждого адреса назначения (каждой директории с данными для отправки), в StorageDistributed создаётся отдельный поток,
* который следит за директорией и отправляет данные. */
/** The write is asynchronous - the data is first written to the local file system, and then sent to the remote servers.
* If the Distributed table uses more than one shard, then in order to support the write,
* when creating the table, an additional parameter must be specified for ENGINE - the sharding key.
* Sharding key is an arbitrary expression from the columns. For example, rand() or UserID.
* When writing, the data block is splitted by the remainder of the division of the sharding key by the total weight of the shards,
* and the resulting blocks are written in a compressed Native format in separate directories for sending.
* For each destination address (each directory with data to send), a separate thread is created in StorageDistributed,
* which monitors the directory and sends data. */
class DistributedBlockOutputStream : public IBlockOutputStream
......@@ -15,67 +15,67 @@ namespace DB
class Context;
/** Описание таблицы.
* Не thread safe. См. IStorage::lockStructure().
/** Description of the table.
* Do not thread safe. See IStorage::lockStructure ().
class ITableDeclaration
/** Имя таблицы.
/** The name of the table.
virtual std::string getTableName() const = 0;
/** Получить список имён и типов столбцов таблицы, только невиртуальные.
/** Get a list of names and table column types, only non-virtual.
NamesAndTypesList getColumnsList() const;
const NamesAndTypesList & getColumnsListNonMaterialized() const { return getColumnsListImpl(); }
/** Получить список имён столбцов таблицы, только невиртуальные.
/** Get a list of column table names, only non-virtual.
virtual Names getColumnNamesList() const;
/** Получить описание реального (невиртуального) столбца по его имени.
/** Get a description of the real (non-virtual) column by its name.
virtual NameAndTypePair getRealColumn(const String & column_name) const;
/** Присутствует ли реальный (невиртуальный) столбец с таким именем.
/** Is there a real (non-virtual) column with that name.
virtual bool hasRealColumn(const String & column_name) const;
NameAndTypePair getMaterializedColumn(const String & column_name) const;
bool hasMaterializedColumn(const String & column_name) const;
/** Получить описание любого столбца по его имени.
/** Get a description of any column by its name.
virtual NameAndTypePair getColumn(const String & column_name) const;
/** Присутствует ли столбец с таким именем.
/** Is there a column with that name.
virtual bool hasColumn(const String & column_name) const;
const DataTypePtr getDataTypeByName(const String & column_name) const;
/** То же самое, но в виде блока-образца.
/** The same, but in the form of a block-sample.
Block getSampleBlock() const;
Block getSampleBlockNonMaterialized() const;
/** Проверить, что все запрошенные имена есть в таблице и заданы корректно.
* (список имён не пустой и имена не повторяются)
/** Verify that all the requested names are in the table and are set correctly.
* (the list of names is not empty and the names do not repeat)
void check(const Names & column_names) const;
/** Проверить, что все запрошенные имена есть в таблице и имеют правильные типы.
/** Check that all the requested names are in the table and have the correct types.
void check(const NamesAndTypesList & columns) const;
/** Проверить, что все имена из пересечения names и columns есть в таблице и имеют одинаковые типы.
/** Check that all names from the intersection of `names` and `columns` are in the table and have the same types.
void check(const NamesAndTypesList & columns, const Names & column_names) const;
/** Проверить, что блок с данными для записи содержит все столбцы таблицы с правильными типами,
* содержит только столбцы таблицы, и все столбцы различны.
* Если need_all, еще проверяет, что все столбцы таблицы есть в блоке.
/** Check that the data block for the record contains all the columns of the table with the correct types,
* contains only the columns of the table, and all the columns are different.
* If need_all, still checks that all the columns of the table are in the block.
void check(const Block & block, bool need_all = false) const;
......@@ -13,11 +13,11 @@ namespace ErrorCodes
extern const int LOGICAL_ERROR;
/** Примитив синхронизации. Работает следующим образом:
* При создании создает неэфемерную инкрементную ноду и помечает ее как заблокированную (LOCKED).
* unlock() разблокирует ее (UNLOCKED).
* При вызове деструктора или завершении сессии в ZooKeeper, переходит в состояние ABANDONED.
* (В том числе при падении программы).
/** The synchronization is primitive. Works as follows:
* Creates a non-ephemeral incremental node and marks it as locked (LOCKED).
* `unlock()` unlocks it (UNLOCKED).
* When the destructor is called or the session ends in ZooKeeper, it goes into the ABANDONED state.
* (Including when the program is halted).
class AbandonableLockInZooKeeper : private boost::noncopyable
......@@ -33,10 +33,10 @@ public:
const String & path_prefix_, const String & temp_path, zkutil::ZooKeeper & zookeeper_)
: zookeeper(zookeeper_), path_prefix(path_prefix_)
/// Создадим вспомогательную эфемерную ноду.
/// Let's create an secondary ephemeral node.
holder_path = zookeeper.create(temp_path + "/abandonable_lock-", "", zkutil::CreateMode::EphemeralSequential);
/// Запишем в основную ноду путь к вспомогательной.
/// Write the path to the secondary node in the main node.
path = zookeeper.create(path_prefix, holder_path, zkutil::CreateMode::PersistentSequential);
if (path.size() <= path_prefix.size())
......@@ -56,7 +56,7 @@ public:
return path;
/// Распарсить число в конце пути.
/// Parse the number at the end of the path.
UInt64 getNumber() const
return parse<UInt64>(path.c_str() + path_prefix.size(), path.size() - path_prefix.size());
......@@ -69,7 +69,7 @@ public:
holder_path = "";
/// Добавляет в список действия, эквивалентные unlock().
/// Adds actions equivalent to `unlock()` to the list.
void getUnlockOps(zkutil::Ops & ops)
ops.emplace_back(std::make_unique<zkutil::Op::Remove>(path, -1));
......@@ -84,7 +84,7 @@ public:
zookeeper.trySet(path, ""); /// Это не обязательно.
zookeeper.trySet(path, ""); /// It's not necessary.
catch (...)
......@@ -96,21 +96,21 @@ public:
String holder_path;
/// Если нет основной ноды, UNLOCKED.
/// If there is no main node, UNLOCKED.
if (!zookeeper.tryGet(path, holder_path))
return UNLOCKED;
/// Если в основной ноде нет пути к вспомогательной, ABANDONED.
/// If there is no path to the secondary node in the main node, ABANDONED.
if (holder_path.empty())
/// Если вспомогательная нода жива, LOCKED.
/// If the secondary node is alive, LOCKED.
if (zookeeper.exists(holder_path))
return LOCKED;
/// Если вспомогательной ноды нет, нужно еще раз проверить существование основной ноды,
/// потому что за это время могли успеть вызвать unlock().
/// Заодно уберем оттуда путь к вспомогательной ноде.
/// If there is no secondary node, you need to test again the existence of the main node,
/// because during this time you might have time to call unlock().
/// At the same time, we will remove the path to the secondary node from there.
if (zookeeper.trySet(path, "") == ZOK)
......@@ -8,10 +8,10 @@
namespace DB
/** Поддерживает множество названий активных кусков данных.
* Повторяет часть функциональности MergeTreeData.
* TODO: обобщить с MergeTreeData. Можно этот класс оставить примерно как есть и использовать его из MergeTreeData.
* Тогда в MergeTreeData можно сделать map<String, DataPartPtr> data_parts и all_data_parts.
/** Supports multiple names of active parts of data.
* Repeats part of the MergeTreeData functionality.
* TODO: generalize with MergeTreeData. It is possible to leave this class approximately as is and use it from MergeTreeData.
* Then in MergeTreeData you can make map<String, DataPartPtr> data_parts and all_data_parts.
class ActiveDataPartSet
......@@ -45,10 +45,10 @@ public:
return false;
/// Содержит другой кусок (получен после объединения другого куска с каким-то ещё)
/// Contains another part (obtained after combining another part with some other)
bool contains(const Part & rhs) const
return month == rhs.month /// Куски за разные месяцы не объединяются
return month == rhs.month /// Parts for different months are not combined
&& left_date <= rhs.left_date
&& right_date >= rhs.right_date
&& left <= rhs.left
......@@ -59,19 +59,19 @@ public:
void add(const String & name);
/// Если не найдено - возвращает пустую строку.
/// If not found, returns an empty string.
String getContainingPart(const String & name) const;
Strings getParts() const; /// В порядке возрастания месяца и номера блока.
Strings getParts() const; /// In ascending order of the month and block number.
size_t size() const;
static String getPartName(DayNum_t left_date, DayNum_t right_date, Int64 left_id, Int64 right_id, UInt64 level);
/// Возвращает true если имя директории совпадает с форматом имени директории кусочков
/// Returns true if the directory name matches the format of the directory name of the parts
static bool isPartDirectory(const String & dir_name, Poco::RegularExpression::MatchVec * out_matches = nullptr);
/// Кладет в DataPart данные из имени кусочка.
/// Put data in DataPart from the name of the part.
static void parsePartName(const String & file_name, Part & part, const Poco::RegularExpression::MatchVec * matches = nullptr);
static bool contains(const String & outer_part_name, const String & inner_part_name);
......@@ -82,7 +82,7 @@ private:
mutable std::mutex mutex;
Parts parts;
/// Не блокируют mutex.
/// Do not block mutex.
void addImpl(const String & name);
String getContainingPartImpl(const String & name) const;
......@@ -15,11 +15,11 @@
namespace DB
/** Используя фиксированное количество потоков, выполнять произвольное количество задач в бесконечном цикле.
* При этом, одна задача может выполняться одновременно из разных потоков.
* Предназначена для задач, выполняющих постоянную фоновую работу (например, слияния).
* Задача - функция, возвращающая bool - сделала ли она какую-либо работу.
* Если не сделала, то в следующий раз будет выполнена позже.
/** Using a fixed number of threads, perform an arbitrary number of tasks in an infinite loop.
* In this case, one task can run simultaneously from different threads.
* Designed for tasks that perform continuous background work (for example, merge).
* `Task` is a function that returns a bool - did it do any work.
* If not, then the next time will be done later.
class BackgroundProcessingPool
#pragma once
/// Множество значений булевой переменной. То есть два булевых значения: может ли быть true, может ли быть false.
/// Multiple Boolean values. That is, two Boolean values: can it be true, can it be false.
struct BoolMask
bool can_be_true;
......@@ -12,7 +12,7 @@ namespace DB
namespace DataPartsExchange
/** Сервис для отправки кусков из таблицы *MergeTree.
/** Service for sending parts from the table *MergeTree.
class Service final : public InterserverIOEndpoint
......@@ -36,7 +36,7 @@ private:
Logger * log;
/** Клиент для получения кусков из таблицы *MergeTree.
/** Client for getting the parts from the table *MergeTree.
class Fetcher final
......@@ -46,7 +46,7 @@ public:
Fetcher(const Fetcher &) = delete;
Fetcher & operator=(const Fetcher &) = delete;
/// Скачивает кусок в tmp_директорию. Если to_detached - скачивает в директорию detached.
/// Downloads a part to tmp_directory. If to_detached - downloads to the `detached` directory.
MergeTreeData::MutableDataPartPtr fetchPart(
const String & part_name,
const String & replica_path,
......@@ -54,8 +54,8 @@ public:
int port,
bool to_detached = false);
/// Метод для перешардирования. Скачивает шардированный кусок
/// из заданного шарда в папку to_detached.
/// Method for resharding. Downloads a sharded part
/// from the specified shard to the `to_detached` folder.
MergeTreeData::MutableDataPartPtr fetchShardedPart(
const InterserverIOEndpointLocation & location,
const String & part_name,
......@@ -74,7 +74,7 @@ private:
MergeTreeData & data;
/// Нужно остановить передачу данных.
/// You need to stop the data transfer.
std::atomic<bool> is_cancelled {false};
Logger * log;
......@@ -8,7 +8,7 @@ namespace DB
/** Пара засечек, определяющая диапазон строк в куске. Именно, диапазон имеет вид [begin * index_granularity, end * index_granularity).
/** A pair of marks that defines the range of rows in a part. Specifically, the range has the form [begin * index_granularity, end * index_granularity).
struct MarkRange
......@@ -13,11 +13,11 @@ using MergeTreeReadTaskPtr = std::unique_ptr<MergeTreeReadTask>;
using MergeTreeBlockSizePredictorPtr = std::shared_ptr<MergeTreeBlockSizePredictor>;
/** Если некоторых запрошенных столбцов нет в куске,
* то выясняем, какие столбцы может быть необходимо дополнительно прочитать,
* чтобы можно было вычислить DEFAULT выражение для этих столбцов.
* Добавляет их в columns.
/** If some of the requested columns are not in the part,
* then find out which columns may need to be read further,
* so that you can calculate the DEFAULT expression for these columns.
* Adds them to the `columns`.
NameSet injectRequiredColumns(const MergeTreeData & storage, const MergeTreeData::DataPartPtr & part, Names & columns);
......@@ -400,7 +400,6 @@ public:
SortDescription getSortDescription() const { return sort_descr; }
/// Check that the part is not broken and calculate the checksums for it if they are not present.
Check that the part is not broken and calculate the checksums for it if they are not present.
MutableDataPartPtr loadPartAndFixMetadata(const String & relative_path);
/** Create local backup (snapshot) for parts with specified prefix.
......@@ -13,7 +13,7 @@ class MergeProgressCallback;
struct ReshardingJob;
/** Умеет выбирать куски для слияния и сливать их.
/** Can select the parts to merge and merge them.
class MergeTreeDataMerger
......@@ -36,12 +36,12 @@ public:
size_t getMaxPartsSizeForMerge(size_t pool_size, size_t pool_used);
/** Выбирает, какие куски слить. Использует кучу эвристик.
/** Selects which parts to merge. Uses a lot of heuristics.
* can_merge - функция, определяющая, можно ли объединить пару соседних кусков.
* Эта функция должна координировать слияния со вставками и другими слияниями, обеспечивая, что:
* - Куски, между которыми еще может появиться новый кусок, нельзя сливать. См. METR-7001.
* - Кусок, который уже сливается с кем-то в одном месте, нельзя начать сливать в кем-то другим в другом месте.
* can_merge - a function that determines if it is possible to merge a pair of adjacent parts.
* This function must coordinate merge with inserts and other merges, ensuring that
* - Parts between which another part can still appear can not be merged. Refer to METR-7001.
* - A part that already merges with something in one place, you can not start to merge into something else in another place.
bool selectPartsToMerge(
MergeTreeData::DataPartsVector & what,
......@@ -50,8 +50,8 @@ public:
size_t max_total_size_to_merge,
const AllowedMergingPredicate & can_merge);
/** Выбрать для слияния все куски в заданной партиции, если возможно.
* final - выбирать для слияния даже единственный кусок - то есть, позволять мерджить один кусок "сам с собой".
/** Select all the parts in the specified partition for merge, if possible.
* final - choose to merge even a single part - that is, allow to measure one part "with itself".
bool selectAllPartsToMergeWithinPartition(
MergeTreeData::DataPartsVector & what,
......@@ -61,15 +61,15 @@ public:
DayNum_t partition,
bool final);
/** Сливает куски.
* Если reservation != nullptr, то и дело уменьшает размер зарезервированного места
* приблизительно пропорционально количеству уже выписанных данных.
/** Merge the parts.
* If `reservation != nullptr`, now and then reduces the size of the reserved space
* is approximately proportional to the amount of data already written.
* Создаёт и возвращает временный кусок.
* Чтобы закончить мердж, вызовите функцию renameTemporaryMergedPart.
* Creates and returns a temporary part.
* To end the merge, call the function renameTemporaryMergedPart.
* time_of_merge - время, когда мердж был назначен.
* Важно при использовании ReplicatedGraphiteMergeTree для обеспечения одинакового мерджа на репликах.
* time_of_merge - the time when the merge was assigned.
* Important when using ReplicatedGraphiteMergeTree to provide the same merge on replicas.
MergeTreeData::MutableDataPartPtr mergePartsToTemporaryPart(
MergeTreeData::DataPartsVector & parts, const String & merged_name, MergeListEntry & merge_entry,
......@@ -81,17 +81,17 @@ public:
const String & merged_name,
MergeTreeData::Transaction * out_transaction = nullptr);
/** Перешардирует заданную партицию.
/** Reshards the specified partition.
MergeTreeData::PerShardDataParts reshardPartition(
const ReshardingJob & job,
DiskSpaceMonitor::Reservation * disk_reservation = nullptr);
/// Примерное количество места на диске, нужное для мерджа. С запасом.
/// The approximate amount of disk space needed for merge. With a surplus.
static size_t estimateDiskSpaceForMerge(const MergeTreeData::DataPartsVector & parts);
/** Выбрать все куски принадлежащие одной партиции.
/** Select all parts belonging to the same partition.
MergeTreeData::DataPartsVector selectAllPartsFromPartition(DayNum_t partition);
......@@ -145,7 +145,7 @@ private:
Logger * log;
/// Когда в последний раз писали в лог, что место на диске кончилось (чтобы не писать об этом слишком часто).
/// When the last time you wrote to the log that the disk space was running out (not to write about this too often).
time_t disk_space_warning_time = 0;
CancellationHook cancellation_hook;
......@@ -13,7 +13,7 @@ namespace DB
/// Чексумма одного файла.
/// Checksum of one file.
struct MergeTreeDataPartChecksum
size_t file_size {};
......@@ -34,8 +34,8 @@ struct MergeTreeDataPartChecksum
/** Контрольные суммы всех не временных файлов.
* Для сжатых файлов хранятся чексумма и размер разжатых данных, чтобы не зависеть от способа сжатия.
/** Checksums of all non-temporary files.
* For compressed files, the check sum and the size of the decompressed data are stored to not depend on the compression method.
struct MergeTreeDataPartChecksums
......@@ -48,15 +48,15 @@ struct MergeTreeDataPartChecksums
void add(MergeTreeDataPartChecksums && rhs_checksums);
/// Проверяет, что множество столбцов и их контрольные суммы совпадают. Если нет - бросает исключение.
/// Если have_uncompressed, для сжатых файлов сравнивает чексуммы разжатых данных. Иначе сравнивает только чексуммы файлов.
/// Checks that the set of columns and their checksums are the same. If not, throws an exception.
/// If have_uncompressed, for compressed files it compares the checksums of the decompressed data. Otherwise, it compares only the checksums of the files.
void checkEqual(const MergeTreeDataPartChecksums & rhs, bool have_uncompressed) const;
/// Проверяет, что в директории есть все нужные файлы правильных размеров. Не проверяет чексуммы.
/// Checks that the directory contains all the needed files of the correct size. Does not check the checksum.
void checkSizes(const String & path) const;
/// Сериализует и десериализует в человекочитаемом виде.
bool read(ReadBuffer & in); /// Возвращает false, если чексуммы в слишком старом формате.
/// Serializes and deserializes in human readable form.
bool read(ReadBuffer & in); /// Returns false if the checksum is too old.
bool read_v2(ReadBuffer & in);
bool read_v3(ReadBuffer & in);
bool read_v4(ReadBuffer & in);
......@@ -67,7 +67,7 @@ struct MergeTreeDataPartChecksums
return files.empty();
/// Контрольная сумма от множества контрольных сумм .bin файлов.
/// Checksum from the set of checksums of .bin files.
void summaryDataChecksum(SipHash & hash) const;
String toString() const;
......@@ -78,7 +78,7 @@ struct MergeTreeDataPartChecksums
class MergeTreeData;
/// Описание куска с данными.
/// Description of the data part.
struct MergeTreeDataPart : public ActiveDataPartSet::Part
using Checksums = MergeTreeDataPartChecksums;
......@@ -106,12 +106,12 @@ struct MergeTreeDataPart : public ActiveDataPartSet::Part
MergeTreeData & storage;
size_t size = 0; /// in number of marks.
std::atomic<size_t> size_in_bytes {0}; /// размер в байтах, 0 - если не посчитано;
/// используется из нескольких потоков без блокировок (изменяется при ALTER).
std::atomic<size_t> size_in_bytes {0}; /// size in bytes, 0 - if not counted;
/// is used from several threads without locks (it is changed with ALTER).
time_t modification_time = 0;
mutable time_t remove_time = std::numeric_limits<time_t>::max(); /// Когда кусок убрали из рабочего набора.
mutable time_t remove_time = std::numeric_limits<time_t>::max(); /// When the part is removed from the working set.
/// Если true, деструктор удалит директорию с куском.
/// If true, the destructor will delete the directory with the part.
bool is_temp = false;
/// For resharding.
......@@ -131,30 +131,30 @@ struct MergeTreeDataPart : public ActiveDataPartSet::Part
using ColumnToSize = std::map<std::string, size_t>;
/** Блокируется на запись при изменении columns, checksums или любых файлов куска.
* Блокируется на чтение при чтении columns, checksums или любых файлов куска.
/** It is blocked for writing when changing columns, checksums or any part files.
* Locked to read when reading columns, checksums or any part files.
mutable Poco::RWLock columns_lock;
/** Берется на все время ALTER куска: от начала записи временных фалов до их переименования в постоянные.
* Берется при разлоченном columns_lock.
/** It is taken for the whole time ALTER a part: from the beginning of the recording of the temporary files to their renaming to permanent.
* It is taken with unlocked `columns_lock`.
* NOTE: "Можно" было бы обойтись без этого мьютекса, если бы можно было превращать ReadRWLock в WriteRWLock, не снимая блокировку.
* Такое превращение невозможно, потому что создало бы дедлок, если делать его из двух потоков сразу.
* Взятие этого мьютекса означает, что мы хотим заблокировать columns_lock на чтение с намерением потом, не
* снимая блокировку, заблокировать его на запись.
* NOTE: "You can" do without this mutex if you could turn ReadRWLock into WriteRWLock without removing the lock.
* This transformation is impossible, because it would create a deadlock, if you do it from two threads at once.
* Taking this mutex means that we want to lock columns_lock on read with intention then, not
* unblocking, block it for writing.
mutable std::mutex alter_mutex;
/// Вычисляем суммарный размер всей директории со всеми файлами
/// Calculate the total size of the entire directory with all the files
static size_t calcTotalSize(const String & from);
void remove() const;
void renameTo(const String & new_name) const;
/// Переименовывает кусок, дописав к имени префикс. to_detached - также перенести в директорию detached.
/// Renames a piece by appending a prefix to the name. To_detached - also moved to the detached directory.
void renameAddPrefix(bool to_detached, const String & prefix) const;
/// Loads index file. Also calculates this->size if size=0
......@@ -10,15 +10,15 @@ namespace DB
class PKCondition;
/** Выполняет запросы SELECT на данных из merge-дерева.
/** Executes SELECT queries on data from the merge tree.
class MergeTreeDataSelectExecutor
MergeTreeDataSelectExecutor(MergeTreeData & data_);
/** При чтении, выбирается набор кусков, покрывающий нужный диапазон индекса.
* max_block_number_to_read - если не ноль - не читать все куски, у которых правая граница больше этого порога.
/** When reading, selects a set of parts that covers the desired range of the index.
* max_block_number_to_read - if not zero, do not read all the parts whose right border is greater than this threshold.
BlockInputStreams read(
const Names & column_names,
......@@ -28,7 +28,7 @@ public:
QueryProcessingStage::Enum & processed_stage,
size_t max_block_size,
unsigned threads,
size_t * inout_part_index, /// Если не nullptr, из этого счетчика берутся значения для виртуального столбца _part_index.
size_t * inout_part_index, /// If not nullptr, from this counter values are taken ​​for the virtual column _part_index.
Int64 max_block_number_to_read) const;
......@@ -59,13 +59,13 @@ private:
const Settings & settings,
const Context & context) const;
/// Получить приблизительное значение (оценку снизу - только по полным засечкам) количества строк, попадающего под индекс.
/// Get the approximate value (bottom estimate - only by full marks) of the number of rows falling under the index.
size_t getApproximateTotalRowsToRead(
const MergeTreeData::DataPartsVector & parts,
const PKCondition & key_condition,
const Settings & settings) const;
/// Создать выражение "Sign == 1".
/// Create the expression "Sign == 1".
void createPositiveSignCondition(
ExpressionActionsPtr & out_expression,
String & out_column,
......@@ -36,7 +36,7 @@ struct BlockWithDateInterval
using BlocksWithDateIntervals = std::list<BlockWithDateInterval>;
/** Записывает новые куски с данными в merge-дерево.
/** Writes new parts of data to the merge tree.
class MergeTreeDataWriter
......@@ -11,9 +11,9 @@ class MergeTreePartChecker
struct Settings
bool verbose = false; /// Пишет в stderr прогресс и ошибки, и не останавливается при первой ошибке.
bool require_checksums = false; /// Требует, чтобы был columns.txt.
bool require_column_files = false; /// Требует, чтобы для всех столбцов из columns.txt были файлы.
bool verbose = false; /// Writes progress and errors to stderr, and does not stop at the first error.
bool require_checksums = false; /// Requires column.txt to be.
bool require_column_files = false; /// Requires that all columns from columns.txt have files.
size_t index_granularity = 8192;
Settings & setVerbose(bool verbose_) { verbose = verbose_; return *this; }
......@@ -22,16 +22,16 @@ public:
Settings & setIndexGranularity(size_t index_granularity_) { index_granularity = index_granularity_; return *this; }
/** Полностью проверяет данные кусочка:
* - Вычисляет контрольные суммы и сравнивает с checksums.txt.
* - Для массивов и строк проверяет соответствие размеров и количества данных.
* - Проверяет правильность засечек.
* Бросает исключение, если кусок испорчен или если проверить не получилось (TODO: можно попробовать разделить эти случаи).
/** Completely checks the part data
* - Calculates checksums and compares them with checksums.txt.
* - For arrays and strings, checks the correspondence of the size and amount of data.
* - Checks the correctness of marks.
* Throws an exception if the piece is corrupted or if the check fails (TODO: you can try to separate these cases).
static void checkDataPart(
String path,
const Settings & settings,
const DataTypes & primary_key_data_types, /// Проверять первичный ключ. Если не надо - передайте пустой массив.
const DataTypes & primary_key_data_types, /// Check the primary key. If it is not necessary, pass an empty array.
MergeTreeData::DataPart::Checksums * out_checksums = nullptr,
std::atomic<bool> * is_cancelled = nullptr);
......@@ -26,7 +26,7 @@ using ShardedBlocksWithDateIntervals = std::list<ShardedBlockWithDateInterval>;
struct ReshardingJob;
/** Создаёт новые шардированные куски с данными.
/** Creates new shard parts of data.
class MergeTreeSharder final
......@@ -35,10 +35,10 @@ public:
MergeTreeSharder(const MergeTreeSharder &) = delete;
MergeTreeSharder & operator=(const MergeTreeSharder &) = delete;
/** Разбивает блок на блоки по ключу шардирования, каждый из которых
* нужно записать в отдельный кусок. Работает детерминированно: если
* отдать на вход такой же блок, на выходе получатся такие же блоки в
* таком же порядке.
/** Breaks the block into blocks by the sharding key, each of which
* must be written to a separate part. It works deterministically: if
* give the same block to the input, the output will be the same blocks in the
* in the same order.
ShardedBlocksWithDateIntervals shardBlock(const Block & block);
......@@ -65,7 +65,7 @@ protected:
void addStream(const String & path, const String & name, const IDataType & type, size_t estimated_size,
size_t level, const String & filename, bool skip_offsets);
/// Записать данные одного столбца.
/// Write data of one column.
void writeData(const String & name, const IDataType & type, const IColumn & column, OffsetColumns & offset_columns,
size_t level, bool skip_offsets);
......@@ -73,7 +73,7 @@ protected:
ColumnStreams column_streams;
/// Смещение до первой строчки блока, для которой надо записать индекс.
/// The offset to the first row of the block for which you want to write the index.
size_t index_offset = 0;
size_t min_compress_block_size;
......@@ -90,8 +90,8 @@ private:
/** Для записи одного куска.
* Данные относятся к одному месяцу, и пишутся в один кускок.
/** To write one part.
* The data refers to one month, and are written in one part.
class MergedBlockOutputStream : public IMergedBlockOutputStream
......@@ -112,11 +112,11 @@ public:
std::string getPartPath() const;
/// Если данные заранее отсортированы.
/// If the data is pre-sorted.
void write(const Block & block) override;
/** Если данные не отсортированы, но мы заранее вычислили перестановку, после которой они станут сортированными.
* Этот метод используется для экономии оперативки, так как не нужно держать одновременно два блока - исходный и отсортированный.
/** If the data is not sorted, but we have previously calculated the permutation, after which they will be sorted.
* This method is used to save RAM, since you do not need to keep two blocks at once - the original one and the sorted one.
void writeWithPermutation(const Block & block, const IColumn::Permutation * permutation);
......@@ -130,14 +130,14 @@ public:
MergeTreeData::DataPart::Index & getIndex();
/// Сколько засечек уже записано.
/// How many marks are already written.
size_t marksCount();
void init();
/** Если задана permutation, то переставляет значения в столбцах при записи.
* Это нужно, чтобы не держать целый блок в оперативке для его сортировки.
/** If `permutation` is given, it rearranges the values ​​in the columns when writing.
* This is necessary to not keep the whole block in the RAM to sort it.
void writeImpl(const Block & block, const IColumn::Permutation * permutation);
......@@ -153,7 +153,7 @@ private:
/// Записывает только те, столбцы, что лежат в block
/// Writes only those columns that are in `block`
class MergedColumnOnlyOutputStream : public IMergedBlockOutputStream
......@@ -17,7 +17,7 @@ class IFunction;
using FunctionPtr = std::shared_ptr<IFunction>;
/** Диапазон с открытыми или закрытыми концами; возможно, неограниченный.
/** Range with open or closed ends; Perhaps unlimited.
struct Range
......@@ -26,21 +26,21 @@ private:
static bool less(const Field & lhs, const Field & rhs);
Field left; /// левая граница, если есть
Field right; /// правая граница, если есть
bool left_bounded = false; /// ограничен ли слева
bool right_bounded = false; /// ограничен ли справа
bool left_included = false; /// включает левую границу, если есть
bool right_included = false; /// включает правую границу, если есть
/// Всё множество.
Field left; /// the left border, if any
Field right; /// the right border, if any
bool left_bounded = false; /// limited to the left
bool right_bounded = false; /// limited to the right
bool left_included = false; /// includes the left border, if any
bool right_included = false; /// includes the right border, if any
/// The whole set.
Range() {}
/// Одна точка.
/// One point.
Range(const Field & point)
: left(point), right(point), left_bounded(true), right_bounded(true), left_included(true), right_included(true) {}
/// Ограниченный с двух сторон диапазон.
/// A bounded two-sided range.
Range(const Field & left_, bool left_included_, const Field & right_, bool right_included_)
: left(left_), right(right_),
left_bounded(true), right_bounded(true),
......@@ -69,9 +69,9 @@ public:
return r;
/** Оптимизировать диапазон. Если у него есть открытая граница и тип Field "неплотный"
* - то преобразовать её в закрытую, сузив на единицу.
* То есть, например, превратить (0,2) в [1].
/** Optimize the range. If it has an open boundary and the Field type is "loose"
* - then convert it to closed, narrowing by one.
* That is, for example, turn (0,2) into [1].
void shrinkToIncludedIfPossible()
......@@ -110,13 +110,13 @@ public:
|| ((!left_included || !right_included) && !less(left, right)));
/// x входит в range
/// x contained in the range
bool contains(const Field & x) const
return !leftThan(x) && !rightThan(x);
/// x находится левее
/// x is to the left
bool rightThan(const Field & x) const
return (left_bounded
......@@ -124,7 +124,7 @@ public:
: false);
/// x находится правее
/// x is to the right
bool leftThan(const Field & x) const
return (right_bounded
......@@ -134,7 +134,7 @@ public:
bool intersectsRange(const Range & r) const
/// r левее меня.
/// r to the left of me.
if (r.right_bounded
&& left_bounded
&& (less(r.right, left)
......@@ -142,11 +142,11 @@ public:
&& equals(r.right, left))))
return false;
/// r правее меня.
/// r to the right of me.
if (r.left_bounded
&& right_bounded
&& (less(right, r.left) /// ...} {...
|| ((!right_included || !r.left_included) /// ...)[... или ...](...
|| ((!right_included || !r.left_included) /// ...) [... or ...] (...
&& equals(r.left, right))))
return false;
......@@ -155,7 +155,7 @@ public:
bool containsRange(const Range & r) const
/// r начинается левее меня.
/// r starts to the left of me.
if (left_bounded
&& (!r.left_bounded
|| less(r.left, left)
......@@ -164,7 +164,7 @@ public:
&& equals(r.left, left))))
return false;
/// r заканчивается правее меня.
/// r ends right of me.
if (right_bounded
&& (!r.right_bounded
|| less(right, r.right)
......@@ -190,59 +190,59 @@ public:
class ASTSet;
/** Условие на индекс.
/** Condition on the index.
* Состоит из условий на принадлежность ключа всевозможным диапазонам или множествам,
* а также логических связок AND/OR/NOT над этими условиями.
* Consists of the conditions for the key belonging to all possible ranges or sets,
* as well as logical links AND/OR/NOT above these conditions.
* Составляет reverse polish notation от этих условий
* и умеет вычислять (интерпретировать) её выполнимость над диапазонами ключа.
* Constructs a reverse polish notation from these conditions
* and can calculate (interpret) its feasibility over key ranges.
class PKCondition
/// Не учитывает секцию SAMPLE. all_columns - набор всех столбцов таблицы.
/// Does not include the SAMPLE section. all_columns - the set of all columns of the table.
PKCondition(ASTPtr & query, const Context & context, const NamesAndTypesList & all_columns, const SortDescription & sort_descr,
const Block & pk_sample_block);
/// Выполнимо ли условие в диапазоне ключей.
/// left_pk и right_pk должны содержать все поля из sort_descr в соответствующем порядке.
/// data_types - типы столбцов первичного ключа.
/// Whether the condition is feasible in the key range.
/// left_pk and right_pk must contain all fields in the sort_descr in the appropriate order.
/// data_types - the types of the primary key columns.
bool mayBeTrueInRange(size_t used_key_size, const Field * left_pk, const Field * right_pk, const DataTypes & data_types) const;
/// Выполнимо ли условие в полубесконечном (не ограниченном справа) диапазоне ключей.
/// left_pk должен содержать все поля из sort_descr в соответствующем порядке.
/// Is the condition valid in a semi-infinite (not limited to the right) key range.
/// left_pk must contain all the fields in the sort_descr in the appropriate order.
bool mayBeTrueAfter(size_t used_key_size, const Field * left_pk, const DataTypes & data_types) const;
/// Проверяет, что индекс не может быть использован.
/// Checks that the index can not be used.
bool alwaysUnknownOrTrue() const;
/// Получить максимальный номер используемого в условии элемента первичного ключа.
/// Get the maximum number of the primary key element used in the condition.
size_t getMaxKeyColumn() const;
/// Наложить дополнительное условие: значение в столбце column должно быть в диапазоне range.
/// Возвращает, есть ли такой столбец в первичном ключе.
/// Impose an additional condition: the value in the column column must be in the `range` range.
/// Returns whether there is such a column in the primary key.
bool addCondition(const String & column, const Range & range);
String toString() const;
/// Выражение хранится в виде обратной польской строки (Reverse Polish Notation).
/// The expression is stored as Reverse Polish Notation.
struct RPNElement
enum Function
/// Атомы логического выражения.
/// Atoms of a Boolean expression.
FUNCTION_UNKNOWN, /// Может принимать любое значение.
/// Операторы логического выражения.
FUNCTION_UNKNOWN, /// Can take any value.
/// Operators of the logical expression.
/// Константы
/// Constants
......@@ -257,18 +257,18 @@ public:
Function function = FUNCTION_UNKNOWN;
Range range;
size_t key_column;
ASTPtr in_function;
/** Цепочка возможно-монотонных функций.
* Если столбец первичного ключа завёрнут в функции, которые могут быть монотонными в некоторых диапазонах значений
* (например: -toFloat64(toDayOfWeek(date))), то здесь будут расположены функции: toDayOfWeek, toFloat64, negate.
/** A chain of possibly monotone functions.
* If the primary key column is wrapped in functions that can be monotonous in some value ranges
* (for example: -toFloat64(toDayOfWeek(date))), then here the functions will be located: toDayOfWeek, toFloat64, negate.
using MonotonicFunctionsChain = std::vector<FunctionPtr>;
mutable MonotonicFunctionsChain monotonic_functions_chain; /// Выполнение функции не нарушает константность.
mutable MonotonicFunctionsChain monotonic_functions_chain; /// The function execution does not violate the constancy.
static Block getBlockWithConstants(
......@@ -12,7 +12,7 @@ class Context;
namespace RemoteDiskSpaceMonitor
/** Сервис для получения информации о свободном месте на диске.
/** Service to get information about free disk space.
class Service final : public InterserverIOEndpoint
......@@ -27,7 +27,7 @@ private:
const Context & context;
/** Клиент для получения информации о свободном месте на удалённом диске.
/** Client to get information about free space on a remote disk.
class Client final
......@@ -11,7 +11,7 @@ class Context;
namespace RemoteQueryExecutor
/** Сервис для выполнения SQL запросов.
/** Service for executing SQL queries.
class Service final : public InterserverIOEndpoint
......@@ -26,7 +26,7 @@ private:
Context & context;
/** Клиент для удалённого выполнения SQL запросов.
/** Client for remote execution of SQL queries.
class Client final
......@@ -8,7 +8,7 @@
namespace DB
/// Позволяет узнать, куда отправлять запросы, чтобы попасть на реплику.
/// Lets you know where to send requests to get to the replica.
struct ReplicatedMergeTreeAddress
......@@ -12,10 +12,10 @@ namespace DB
class StorageReplicatedMergeTree;
/** Следит за изменением структуры таблицы в ZooKeeper и выполняет необходимые преобразования.
/** Keeps track of changing the table structure in ZooKeeper and performs the necessary conversions.
* NOTE Это не имеет отношения к манипуляциям с партициями,
* которые обрабатываются через очередь репликации.
* NOTE This has nothing to do with manipulating partitions,
* which are processed through the replication queue.
class ReplicatedMergeTreeAlterThread
......@@ -10,7 +10,7 @@ namespace DB
class StorageReplicatedMergeTree;
/** Удаляет устаревшие данные таблицы типа ReplicatedMergeTree.
/** Removes obsolete data from a table of type ReplicatedMergeTree.
class ReplicatedMergeTreeCleanupThread
......@@ -31,17 +31,17 @@ private:
void run();
void iterate();
/// Удалить старые куски с диска и из ZooKeeper.
/// Delete old chunks from disk and from ZooKeeper.
void clearOldParts();
/// Удалить из ZooKeeper старые записи в логе.
/// Remove old records from ZooKeeper.
void clearOldLogs();
/// Удалить из ZooKeeper старые хеши блоков. Это делает ведущая реплика.
/// Remove old block hashes from ZooKeeper. This makes a leading replica.
void clearOldBlocks();
/// TODO Удаление старых quorum/failed_parts
/// TODO Удаление старых nonincrement_block_numbers
/// TODO Removing old quorum/failed_parts
/// TODO Removing old nonincrement_block_numbers
......@@ -26,16 +26,16 @@ namespace ErrorCodes
/// Запись о том, что нужно сделать. Только данные (их можно копировать).
/// Record about what needs to be done. Only data (you can copy them).
struct ReplicatedMergeTreeLogEntryData
enum Type
EMPTY, /// Не используется.
GET_PART, /// Получить кусок с другой реплики.
MERGE_PARTS, /// Слить куски.
DROP_RANGE, /// Удалить куски в указанном месяце в указанном диапазоне номеров.
ATTACH_PART, /// Перенести кусок из директории detached или unreplicated.
EMPTY, /// Not used.
GET_PART, /// Get the part from another replica.
MERGE_PARTS, /// Merge the parts.
DROP_RANGE, /// Delete the parts in the specified month in the specified number range.
ATTACH_PART, /// Move a part from the `detached` or `unreplicated` directory.
String typeToString() const
......@@ -58,38 +58,38 @@ struct ReplicatedMergeTreeLogEntryData
String znode_name;
Type type = EMPTY;
String source_replica; /// Пустая строка значит, что эта запись была добавлена сразу в очередь, а не скопирована из лога.
String source_replica; /// Empty string means that this entry was added to the queue immediately, and not copied from the log.
/// Имя куска, получающегося в результате.
/// Для DROP_RANGE имя несуществующего куска. Нужно удалить все куски, покрытые им.
/// The name of resulting part.
/// For DROP_RANGE, the name of a non-existent part. You need to remove all the parts covered by it.
String new_part_name;
String block_id; /// Для кусков нулевого уровня - идентификатор блока для дедупликации (имя ноды в /blocks/).
String block_id; /// For parts of level zero, the block identifier for deduplication (node ​​name in /blocks /).
Strings parts_to_merge;
/// Для DROP_RANGE, true значит, что куски нужно не удалить, а перенести в директорию detached.
/// For DROP_RANGE, true means that the parts need not be deleted, but moved to the `detached` directory.
bool detach = false;
/// Для ATTACH_PART имя куска в директории detached или unreplicated.
/// For ATTACH_PART, the name of the part in the `detached` or `unreplicated` directory.
String source_part_name;
/// Нужно переносить из директории unreplicated, а не detached.
/// Must be moved from the `unreplicated` directory, not `detached`.
bool attach_unreplicated = false;
/// Доступ под queue_mutex, см. ReplicatedMergeTreeQueue.
bool currently_executing = false; /// Выполняется ли действие сейчас.
/// Эти несколько полей имеют лишь информационный характер (для просмотра пользователем с помощью системных таблиц).
/// Доступ под queue_mutex, см. ReplicatedMergeTreeQueue.
size_t num_tries = 0; /// Количество попыток выполнить действие (с момента старта сервера; включая выполняющееся).
std::exception_ptr exception; /// Последний эксепшен, в случае безуспешной попытки выполнить действие.
time_t last_attempt_time = 0; /// Время начала последней попытки выполнить действие.
size_t num_postponed = 0; /// Количество раз, когда действие было отложено.
String postpone_reason; /// Причина, по которой действие было отложено, если оно отложено.
time_t last_postpone_time = 0; /// Время последнего раза, когда действие было отложено.
/// Время создания или время копирования из общего лога в очередь конкретной реплики.
/// Access under queue_mutex, see ReplicatedMergeTreeQueue.
bool currently_executing = false; /// Whether the action is executing now.
/// These several fields are informational only (for viewing by the user using system tables).
/// Access under queue_mutex, see ReplicatedMergeTreeQueue.
size_t num_tries = 0; /// The number of attempts to perform the action (since the server started, including the running one).
std::exception_ptr exception; /// The last exception, in the case of an unsuccessful attempt to perform the action.
time_t last_attempt_time = 0; /// The time at which the last attempt was attempted to complete the action.
size_t num_postponed = 0; /// The number of times the action was postponed.
String postpone_reason; /// The reason why the action was postponed, if it was postponed.
time_t last_postpone_time = 0; /// The time of the last time the action was postponed.
/// Creation time or the time to copy from the general log to the queue of a particular replica.
time_t create_time = 0;
/// Величина кворума (для GET_PART) - ненулевое значение при включенной кворумной записи.
/// The quorum value (for GET_PART) is a non-zero value when the quorum write is enabled.
size_t quorum = 0;
......@@ -98,7 +98,7 @@ struct ReplicatedMergeTreeLogEntry : ReplicatedMergeTreeLogEntryData
using Ptr = std::shared_ptr<ReplicatedMergeTreeLogEntry>;
std::condition_variable execution_complete; /// Пробуждается когда currently_executing становится false.
std::condition_variable execution_complete; /// Awake when currently_executing becomes false.
static Ptr parse(const String & s, const Stat & stat);
......@@ -18,19 +18,19 @@ namespace DB
class StorageReplicatedMergeTree;
/** Проверяет целостность кусков, запрошенных для проверки.
/** Checks the integrity of the parts requested for validation.
* Определяет лишние куски и убирает их из рабочего набора.
* Находит отсутствующие куски и добавляет их для скачивания с реплик.
* Проверяет целостность данных и, в случае нарушения,
* убирает кусок из рабочего набора и добавляет для скачивания с реплик.
* Identifies the extra parts and removes them from the working set.
* Find the missing parts and add them for download from replicas.
* Checks the integrity of the data and, in the event of a violation,
* removes a part from the working set and adds it for download from replicas.
class ReplicatedMergeTreePartCheckThread
ReplicatedMergeTreePartCheckThread(StorageReplicatedMergeTree & storage_);
/// Разбор очереди для проверки осуществляется в фоновом потоке, который нужно сначала запустить.
/// Processing of the queue to be checked is done in the background thread, which you must first start.
void start();
void stop();
......@@ -58,11 +58,11 @@ public:
TemporarilyStop temporarilyStop() { return TemporarilyStop(this); }
/// Добавить кусок (для которого есть подозрения, что он отсутствует, повреждён или не нужен) в очередь для проверки.
/// delay_to_check_seconds - проверять не раньше чем через указанное количество секунд.
/// Add a part (for which there are suspicions that it is missing, damaged or not needed) in the queue for check.
/// delay_to_check_seconds - check no sooner than the specified number of seconds.
void enqueuePart(const String & name, time_t delay_to_check_seconds = 0);
/// Получить количество кусков в очереди для проверки.
/// Get the number of parts in the queue for check.
size_t size() const;
......@@ -80,12 +80,12 @@ private:
Logger * log;
using StringSet = std::set<String>;
using PartToCheck = std::pair<String, time_t>; /// Имя куска и минимальное время для проверки (или ноль, если не важно).
using PartToCheck = std::pair<String, time_t>; /// The name of the part and the minimum time to check (or zero, if not important).
using PartsToCheckQueue = std::list<PartToCheck>;
/** Куски, для которых нужно проверить одно из двух:
* - Если кусок у нас есть, сверить, его данные с его контрольными суммами, а их с ZooKeeper.
* - Если куска у нас нет, проверить, есть ли он (или покрывающий его кусок) хоть у кого-то.
/** Parts for which you want to check one of two:
* - If we have the part, check, its data with its checksums, and them with ZooKeeper.
* - If we do not have a part, check to see if it (or the part covering it) exists anywhere.
StringSet parts_set;
......@@ -33,7 +33,7 @@ private:
/// Для вычисления min_unprocessed_insert_time, max_processed_insert_time, по которым вычисляется отставание реплик.
/// To calculate min_unprocessed_insert_time, max_processed_insert_time, for which the replica lag is calculated.
using InsertsByTime = std::set<LogEntryPtr, ByTime>;
......@@ -41,8 +41,8 @@ private:
String replica_path;
String logger_name;
/** Очередь того, что нужно сделать на этой реплике, чтобы всех догнать. Берется из ZooKeeper (/replicas/me/queue/).
* В ZK записи в хронологическом порядке. Здесь - не обязательно.
/** The queue of what you need to do on this line to catch up. It is taken from ZooKeeper (/replicas/me/queue/).
* In ZK records in chronological order. Here it is not necessary.
Queue queue;
......@@ -52,51 +52,51 @@ private:
time_t last_queue_update = 0;
/// Куски, которые появятся в результате действий, выполняемых прямо сейчас фоновыми потоками (этих действий нет в очереди).
/// Используется, чтобы не выполнять в тот же момент другие действия с этими кусками.
/// parts that will appear as a result of actions performed right now by background threads (these actions are not in the queue).
/// Used to not perform other actions at the same time with these parts.
StringSet future_parts;
/// На доступ к queue, future_parts, ...
/// To access the queue, future_parts, ...
std::mutex mutex;
/// Обеспечивает только один одновременный вызов pullLogsToQueue.
/// Provides only one simultaneous call to pullLogsToQueue.
std::mutex pull_logs_to_queue_mutex;
/** Каким будет множество активных кусков после выполнения всей текущей очереди - добавления новых кусков и выполнения слияний.
* Используется, чтобы определять, какие мерджи уже были назначены:
* - если в этом множестве есть кусок, то мерджи более мелких кусков внутри его диапазона не делаются.
* Дополнительно, сюда также добавляются специальные элементы, чтобы явно запретить мерджи в некотором диапазоне (см. disableMergesInRange).
* Это множество защищено своим mutex-ом.
/** What will be the set of active parts after running the entire current queue - adding new parts and performing merges.
* Used to determine which merges have already been assigned:
* - if there is a part in this set, then the smaller parts inside its range are not made.
* Additionally, special elements are also added here to explicitly disallow the merge in a certain range (see disableMergesInRange).
* This set is protected by its mutex.
ActiveDataPartSet virtual_parts;
Logger * log = nullptr;
/// Положить набор (уже существующих) кусков в virtual_parts.
/// Put a set of (already existing) parts in virtual_parts.
void initVirtualParts(const MergeTreeData::DataParts & parts);
/// Загрузить (инициализировать) очередь из ZooKeeper (/replicas/me/queue/).
/// Load (initialize) a queue from ZooKeeper (/replicas/me/queue/).
void load(zkutil::ZooKeeperPtr zookeeper);
void insertUnlocked(LogEntryPtr & entry);
void remove(zkutil::ZooKeeperPtr zookeeper, LogEntryPtr & entry);
/** Можно ли сейчас попробовать выполнить это действие. Если нет, нужно оставить его в очереди и попробовать выполнить другое.
* Вызывается под queue_mutex.
/** Can I now try this action. If not, you need to leave it in the queue and try another one.
* Called under queue_mutex.
bool shouldExecuteLogEntry(const LogEntry & entry, String & out_postpone_reason, MergeTreeDataMerger & merger, MergeTreeData & data);
/// После удаления элемента очереди, обновить времена insert-ов в оперативке. Выполняется под queue_mutex.
/// Возвращает информацию, какие времена изменились - эту информацию можно передать в updateTimesInZooKeeper.
/// After removing the queue element, update the insertion times in the RAM. Running under queue_mutex.
/// Returns information about what times have changed - this information can be passed to updateTimesInZooKeeper.
void updateTimesOnRemoval(const LogEntryPtr & entry, bool & min_unprocessed_insert_time_changed, bool & max_processed_insert_time_changed);
/// Обновить времена insert-ов в ZooKeeper.
/// Update the insertion times in ZooKeeper.
void updateTimesInZooKeeper(zkutil::ZooKeeperPtr zookeeper, bool min_unprocessed_insert_time_changed, bool max_processed_insert_time_changed);
/// Помечает элемент очереди как выполняющийся.
/// Marks the element of the queue as running.
class CurrentlyExecuting
......@@ -105,7 +105,7 @@ private:
friend class ReplicatedMergeTreeQueue;
/// Создаётся только в функции selectEntryToProcess. Вызывается под mutex-ом.
/// Created only in the selectEntryToProcess function. It is called under mutex.
CurrentlyExecuting(ReplicatedMergeTreeQueue::LogEntryPtr & entry, ReplicatedMergeTreeQueue & queue);
......@@ -117,55 +117,55 @@ public:
void initialize(const String & zookeeper_path_, const String & replica_path_, const String & logger_name_,
const MergeTreeData::DataParts & parts, zkutil::ZooKeeperPtr zookeeper);
/** Вставить действие в конец очереди.
* Для восстановления битых кусков во время работы.
* Не вставляет само действие в ZK (сделайте это самостоятельно).
/** Paste action to the end of the queue.
* To restore broken parts during operation.
* Do not insert the action itself into ZK (do it yourself).
void insert(zkutil::ZooKeeperPtr zookeeper, LogEntryPtr & entry);
/** Удалить действие с указанным куском (в качестве new_part_name) из очереди.
* Вызывается для невыполнимых действий в очереди - старых потерянных кусков.
/** Delete the action with the specified part (as new_part_name) from the queue.
* Called for unreachable actions in the queue - old lost parts.
bool remove(zkutil::ZooKeeperPtr zookeeper, const String & part_name);
/** Скопировать новые записи из общего лога в очередь этой реплики. Установить log_pointer в соответствующее значение.
* Если next_update_event != nullptr, вызовет это событие, когда в логе появятся новые записи.
* Возвращает true, если новые записи были.
/** Copy the new entries from the shared log to the queue of this replica. Set the log_pointer to the appropriate value.
* If next_update_event != nullptr, will call this event when new entries appear in the log.
* Returns true if new entries have been.
bool pullLogsToQueue(zkutil::ZooKeeperPtr zookeeper, zkutil::EventPtr next_update_event);
/** Удалить из очереди действия с кусками, покрываемыми part_name (из ZK и из оперативки).
* А также дождаться завершения их выполнения, если они сейчас выполняются.
/** Remove the action from the queue with the parts covered by part_name (from ZK and from the RAM).
* And also wait for the completion of their execution, if they are now being executed.
void removeGetsAndMergesInRange(zkutil::ZooKeeperPtr zookeeper, const String & part_name);
/** В случае, когда для выполнения мерджа в part_name недостаёт кусков
* - переместить действия со сливаемыми кусками в конец очереди
* (чтобы раньше скачать готовый смердженный кусок с другой реплики).
/** In the case where there are not enough parts to perform the merge in part_name
* - move actions with merged parts to the end of the queue
* (in order to download a already merged part from another replica).
StringSet moveSiblingPartsForMergeToEndOfQueue(const String & part_name);
/** Выбрать следующее действие для обработки.
* merger используется только чтобы проверить, не приостановлены ли мерджи.
/** Select the next action to process.
* merger is used only to check if the merges is not suspended.
using SelectedEntry = std::pair<ReplicatedMergeTreeQueue::LogEntryPtr, std::unique_ptr<CurrentlyExecuting>>;
SelectedEntry selectEntryToProcess(MergeTreeDataMerger & merger, MergeTreeData & data);
/** Выполнить функцию func для обработки действия.
* При этом, на время выполнения, отметить элемент очереди как выполняющийся
* (добавить в future_parts и другое).
* Если в процессе обработки было исключение - сохраняет его в entry.
* Возвращает true, если в процессе обработки не было исключений.
/** Execute `func` function to handle the action.
* In this case, at runtime, mark the queue element as running
* (add into future_parts and more).
* If there was an exception during processing, it saves it in `entry`.
* Returns true if there were no exceptions during the processing.
bool processEntry(std::function<zkutil::ZooKeeperPtr()> get_zookeeper, LogEntryPtr & entry, const std::function<bool(LogEntryPtr &)> func);
/// Будет ли кусок в будущем слит в более крупный (или мерджи кусков в данном диапазоне запрещены)?
/// Will a part in the future be merged into a larger part (or merges of parts in this range are prohibited)?
bool partWillBeMergedOrMergesDisabled(const String & part_name) const;
/// Запретить слияния в указанном диапазоне.
/// Prohibit merges in the specified range.
void disableMergesInRange(const String & part_name);
/// Посчитать количество слияний в очереди.
/// Count the number of merges in the queue.
size_t countMerges();
struct Status
......@@ -182,21 +182,21 @@ public:
UInt32 last_queue_update;
/// Получить информацию об очереди.
/// Get information about the queue.
Status getStatus();
/// Получить данные элементов очереди.
/// Get the data of the queue elements.
using LogEntriesData = std::vector<ReplicatedMergeTreeLogEntryData>;
void getEntries(LogEntriesData & res);
/// Получить информацию о временах insert-ов.
/// Get information about the insertion times.
void getInsertTimes(time_t & out_min_unprocessed_insert_time, time_t & out_max_processed_insert_time) const;
/** Преобразовать число в строку формате суффиксов автоинкрементных нод в ZooKeeper.
* Поддерживаются также отрицательные числа - для них имя ноды выглядит несколько глупо
* и не соответствует никакой автоинкрементной ноде в ZK.
/** Convert a number to a string in the format of the suffixes of auto-incremental nodes in ZooKeeper.
* Negative numbers are also supported - for them the name of the node looks somewhat silly
* and does not match any auto-incremented node in ZK.
String padIndex(Int64 index);
......@@ -13,9 +13,9 @@
namespace DB
/** Для реализации функциональности "кворумная запись".
* Информация о том, на каких репликах появился вставленный кусок данных,
* и на скольких репликах он должен быть.
/** To implement the functionality of the "quorum write".
* Information about which replicas the inserted part of data appeared on,
* and on how many replicas it should be.
struct ReplicatedMergeTreeQuorumEntry
......@@ -13,10 +13,10 @@ namespace DB
class StorageReplicatedMergeTree;
/** Инициализирует сессию в ZK.
* Выставляет эфемерные ноды. Выставляет нужные для обнаружения реплики значения нод.
* Запускает участие в выборе лидера. Запускает все фоновые потоки.
* Затем следит за тем, не истекла ли сессия. И если истекла - переинициализирует её.
/** Initializes ZK session.
* Exposes ephemeral nodes. It sets the node values ​​that are required for replica detection.
* Starts participation in the leader selection. Starts all background threads.
* Then monitors whether the session has expired. And if it expired, it will reinitialize it.
class ReplicatedMergeTreeRestartingThread
......@@ -51,23 +51,23 @@ private:
Poco::Event wakeup_event;
std::atomic<bool> need_stop {false};
/// Случайные данные, которые мы записали в /replicas/me/is_active.
/// The random data we wrote into `/replicas/me/is_active`.
String active_node_identifier;
std::thread thread;
void run();
/// Запустить или остановить фоновые потоки. Используется для частичной переинициализации при пересоздании сессии в ZooKeeper.
bool tryStartup(); /// Возвращает false, если недоступен ZooKeeper.
/// Start or stop background threads. Used for partial reinitialization when re-creating a session in ZooKeeper.
bool tryStartup(); /// Returns false if ZooKeeper is not available.
/// Отметить в ZooKeeper, что эта реплика сейчас активна.
/// Note in ZooKeeper that this replica is currently active.
void activateReplica();
/// Удалить куски, для которых кворум пофейлился (за то время, когда реплика была неактивной).
/// Delete the parts for which the quorum has failed (for the time when the replica was inactive).
void removeFailedQuorumParts();
/// Если есть недостигнутый кворум, и у нас есть кусок, то добавить эту реплику в кворум.
/// If there is an unreachable quorum, and we have a part, then add this replica to the quorum.
void updateQuorumIfWeHavePart();
void partialShutdown();
......@@ -10,14 +10,14 @@ namespace DB
class StorageReplicatedMergeTree;
/** Описание задачи перешардирования.
/** Description of the task of rescheduling.
struct ReshardingJob final
ReshardingJob() = default;
/// Создаёт описание на основе его сериализованного представления.
/// Creates a description based on its serialized representation.
ReshardingJob(const std::string & serialized_job);
ReshardingJob(const std::string & database_name_, const std::string & table_name_,
......@@ -32,7 +32,7 @@ public:
operator bool() const;
/// Сериализует описание задачи.
/// Serializes the task description.
std::string toString() const;
bool isCoordinated() const;
......@@ -73,7 +73,7 @@ public:
UInt64 subscribe(const std::string & coordinator_id, const std::string & query);
void unsubscribe(const std::string & coordinator_id);
void unsubscribe(const std::string & coordinator_id);
/// Увеличить количество партиций входящих в одну распределённую задачу. Вызывается с исполнителя.
/// Increase the number of partitions included in one distributed task. Called from the executor.
void addPartitions(const std::string & coordinator_id, const PartitionList & partition_list);
/// Rearrange partitions into two categories: coordinated job, uncoordinated job.
/// Returns an iterator to the beginning of the list of uncoordinated jobs.
......@@ -196,9 +196,9 @@ private:
/// Perform one job.
void perform(const std::string & job_descriptor, const std::string & job_name);
/// Разбить куски входящие в партицию на несколько, согласно ключу шардирования.
/// Оновременно перегруппировать эти куски по шардам и слить куски в каждой группе.
/// При завершении этого процесса создаётся новая партиция для каждого шарда.
/// Split the parts of the partition into several, according to the sharding key.
/// Simultaneously regroup these parts by shards and merge the parts in each group.
/// When this process is completed, a new partition is created for each shard.
void createShardedPartitions();
/// Upload all the partitions resulting from source partition resharding to their
......@@ -14,7 +14,7 @@ class StorageReplicatedMergeTree;
namespace ShardedPartitionUploader
/** Сервис для получения кусков из партиции таблицы *MergeTree.
/** Service for retrieving parts from the partitions of the *MergeTree table.
class Service final : public InterserverIOEndpoint
......@@ -31,7 +31,7 @@ private:
Logger * log = &Logger::get("ShardedPartitionUploader::Service");
/** Клиент для отправления кусков из партиции таблицы *MergeTree.
/** Client for sending parts from the partition of the *MergeTree table.
class Client final
......@@ -18,23 +18,23 @@ namespace DB
class Context;
/** При вставке, буферизует данные в оперативке, пока не превышены некоторые пороги.
* Когда пороги превышены - сбрасывает данные в другую таблицу.
* При чтении, читает как из своих буферов, так и из подчинённой таблицы.
/** During insertion, buffers the data in the RAM until certain thresholds are exceeded.
* When thresholds are exceeded, flushes the data to another table.
* When reading, it reads both from its buffers and from the subordinate table.
* Буфер представляет собой набор из num_shards блоков.
* При записи, выбирается номер блока по остатку от деления ThreadNumber на num_shards (или один из других),
* и в соответствующий блок добавляются строчки.
* При использовании блока, он блокируется некоторым mutex-ом. Если при записи, соответствующий блок уже занят
* - пробуем заблокировать следующий по кругу блок, и так не более num_shards раз (далее блокируемся).
* Пороги проверяются при вставке, а также, периодически, в фоновом потоке (чтобы реализовать пороги по времени).
* Пороги действуют независимо для каждого shard-а. Каждый shard может быть сброшен независимо от других.
* Если в таблицу вставляется блок, который сам по себе превышает max-пороги, то он записывается сразу в подчинённую таблицу без буферизации.
* Пороги могут быть превышены. Например, если max_rows = 1 000 000, в буфере уже было 500 000 строк,
* и добавляется кусок из 800 000 строк, то в буфере окажется 1 300 000 строк, и затем такой блок будет записан в подчинённую таблицу
* The buffer is a set of num_shards blocks.
* When writing, select the block number by the remainder of the `ThreadNumber` division by `num_shards` (or one of the others),
* and add rows to the corresponding block.
* When using a block, it is blocked by some mutex. If during write the corresponding block is already occupied
* - try to block the next block clockwise, and so no more than `num_shards` times (further blocked).
* Thresholds are checked on insertion, and, periodically, in the background thread (to implement time thresholds).
* Thresholds act independently for each shard. Each shard can be flushed independently of the others.
* If a block is inserted into the table, which itself exceeds the max-thresholds, it is written directly to the subordinate table without buffering.
* Thresholds can be exceeded. For example, if max_rows = 1 000 000, the buffer already had 500 000 rows,
* and a part of 800,000 lines is added, then there will be 1 300 000 rows in the buffer, and then such a block will be written to the subordinate table
* При уничтожении таблицы типа Buffer и при завершении работы, все данные сбрасываются.
* Данные в буфере не реплицируются, не логгируются на диск, не индексируются. При грубом перезапуске сервера, данные пропадают.
* When you destroy a Buffer type table and when you quit, all data is discarded.
* The data in the buffer is not replicated, not logged to disk, not indexed. With a rough restart of the server, the data is lost.
class StorageBuffer : private ext::shared_ptr_helper<StorageBuffer>, public IStorage
......@@ -43,16 +43,16 @@ friend class BufferBlockInputStream;
friend class BufferBlockOutputStream;
/// Пороги.
/// Thresholds.
struct Thresholds
time_t time; /// Количество секунд от момента вставки первой строчки в блок.
size_t rows; /// Количество строк в блоке.
size_t bytes; /// Количество (несжатых) байт в блоке.
time_t time; /// The number of seconds from the insertion of the first row into the block.
size_t rows; /// The number of rows in the block.
size_t bytes; /// The number of (uncompressed) bytes in the block.
/** num_shards - уровень внутреннего параллелизма (количество независимых буферов)
* Буфер сбрасывается, если превышены все минимальные пороги или хотя бы один из максимальных.
/** num_shards - the level of internal parallelism (the number of independent buffers)
* The buffer is reset if all minimum thresholds or at least one of the maximum thresholds are exceeded.
static StoragePtr create(const std::string & name_, NamesAndTypesListPtr columns_,
const NamesAndTypesList & materialized_columns_,
......@@ -78,7 +78,7 @@ public:
BlockOutputStreamPtr write(ASTPtr query, const Settings & settings) override;
/// Сбрасывает все буферы в подчинённую таблицу.
/// Resets all buffers to the subordinate table.
void shutdown() override;
bool optimize(const String & partition, bool final, const Settings & settings) override;
......@@ -90,7 +90,7 @@ public:
bool supportsIndexForIn() const override { return true; }
bool supportsParallelReplicas() const override { return true; }
/// Структура подчинённой таблицы не проверяется и не изменяется.
/// The structure of the subordinate table is not checked and does not change.
void alter(const AlterCommands & params, const String & database_name, const String & table_name, const Context & context) override;
......@@ -106,7 +106,7 @@ private:
std::mutex mutex;
/// Имеется num_shards независимых буферов.
/// There are `num_shards` of independent buffers.
const size_t num_shards;
std::vector<Buffer> buffers;
......@@ -115,12 +115,12 @@ private:
const String destination_database;
const String destination_table;
bool no_destination; /// Если задано - не записывать данные из буфера, а просто опустошать буфер.
bool no_destination; /// If set, do not write data from the buffer, but simply empty the buffer.
Poco::Logger * log;
Poco::Event shutdown_event;
/// Выполняет сброс данных по таймауту.
/// Resets data by timeout.
std::thread flush_thread;
StorageBuffer(const std::string & name_, NamesAndTypesListPtr columns_,
......@@ -132,12 +132,12 @@ private:
const String & destination_database_, const String & destination_table_);
void flushAllBuffers(bool check_thresholds = true);
/// Сбросить буфер. Если выставлено check_thresholds - сбрасывает только если превышены пороги.
/// Reset the buffer. If check_thresholds is set - resets only if thresholds are exceeded.
void flushBuffer(Buffer & buffer, bool check_thresholds);
bool checkThresholds(const Buffer & buffer, time_t current_time, size_t additional_rows = 0, size_t additional_bytes = 0) const;
bool checkThresholdsImpl(size_t rows, size_t bytes, time_t time_passed) const;
/// Аргумент table передаётся, так как иногда вычисляется заранее. Он должен соответствовать destination-у.
/// `table` argument is passed, as it is sometimes evaluated beforehand. It must match the `destination`.
void writeBlockToDestination(const Block & block, StoragePtr table);
void flushThread();
......@@ -13,8 +13,8 @@ class DatabaseCloud;
class Context;
/** Облачная таблица. Может находиться только в облачной базе данных.
* При записи в таблицу, данные записываются в локальные таблицы на нескольких серверах облака.
/** Cloud table. It can only be in the cloud database.
* When writing to a table, data is written to local tables on multiple cloud servers.
class StorageCloud : private ext::shared_ptr_helper<StorageCloud>, public IStorage
......@@ -32,7 +32,7 @@ public:
std::string getName() const override { return "Cloud"; }
std::string getTableName() const override { return name; }
/// Проверка откладывается до метода read. Там проверяется поддержка у использующихся таблиц.
/// The check is postponed to the `read` method. It checks the support of the tables used.
bool supportsSampling() const override { return true; }
bool supportsPrewhere() const override { return true; }
bool supportsFinal() const override { return true; }
......@@ -50,7 +50,7 @@ public:
size_t max_block_size = DEFAULT_BLOCK_SIZE,
unsigned threads = 1) override;
void drop() override {} /// Вся нужная работа в DatabaseCloud::removeTable
void drop() override {} /// All the necessary work in `DatabaseCloud::removeTable`
void rename(const String & new_path_to_db, const String & new_database_name, const String & new_table_name) override
......@@ -18,11 +18,11 @@ class Context;
class StorageDistributedDirectoryMonitor;
/** Распределённая таблица, находящаяся на нескольких серверах.
* Использует данные заданной БД и таблицы на каждом сервере.
/** A distributed table that resides on multiple servers.
* Uses data from the specified database and tables on each server.
* Можно передать один адрес, а не несколько.
* В этом случае, таблицу можно считать удалённой, а не распределённой.
* You can pass one address, not several.
* In this case, the table can be considered remote, rather than distributed.
class StorageDistributed : private ext::shared_ptr_helper<StorageDistributed>, public IStorage
......@@ -32,23 +32,23 @@ class StorageDistributed : private ext::shared_ptr_helper<StorageDistributed>, p
static StoragePtr create(
const std::string & name_, /// Имя таблицы.
NamesAndTypesListPtr columns_, /// Список столбцов.
const std::string & name_, /// The name of the table.
NamesAndTypesListPtr columns_, /// List of columns.
const NamesAndTypesList & materialized_columns_,
const NamesAndTypesList & alias_columns_,
const ColumnDefaults & column_defaults_,
const String & remote_database_, /// БД на удалённых серверах.
const String & remote_table_, /// Имя таблицы на удалённых серверах.
const String & remote_database_, /// database on remote servers.
const String & remote_table_, /// The name of the table on the remote servers.
const String & cluster_name,
Context & context_,
const ASTPtr & sharding_key_,
const String & data_path_);
static StoragePtr create(
const std::string & name_, /// Имя таблицы.
NamesAndTypesListPtr columns_, /// Список столбцов.
const String & remote_database_, /// БД на удалённых серверах.
const String & remote_table_, /// Имя таблицы на удалённых серверах.
const std::string & name_, /// The name of the table.
NamesAndTypesListPtr columns_, /// List of columns.
const String & remote_database_, /// database on remote servers.
const String & remote_table_, /// The name of the table on the remote servers.
ClusterPtr & owned_cluster_,
Context & context_);
......@@ -78,8 +78,8 @@ public:
void drop() override {}
void rename(const String & new_path_to_db, const String & new_database_name, const String & new_table_name) override { name = new_table_name; }
/// в подтаблицах добавлять и удалять столбы нужно вручную
/// структура подтаблиц не проверяется
/// in the sub-tables, you need to manually add and delete columns
/// the structure of the sub-table is not checked
void alter(const AlterCommands & params, const String & database_name, const String & table_name, const Context & context) override;
void shutdown() override;
......@@ -90,7 +90,7 @@ public:
const ASTPtr & sharding_key_expr, bool do_copy, const Field & coordinator,
const Settings & settings) override;
/// От каждой реплики получить описание соответствующей локальной таблицы.
/// From each replica, get a description of the corresponding local table.
BlockInputStreams describe(const Context & context, const Settings & settings);
const ExpressionActionsPtr & getShardingKeyExpr() const { return sharding_key_expr; }
......@@ -156,7 +156,7 @@ private:
bool has_sharding_key;
ExpressionActionsPtr sharding_key_expr;
String sharding_key_column_name;
String path; /// Может быть пустым, если data_path_ пустой. В этом случае, директория для данных для отправки не создаётся.
String path; /// Can be empty if data_path_ is empty. In this case, a directory for the data to be sent is not created.
std::unordered_map<std::string, std::unique_ptr<StorageDistributedDirectoryMonitor>> directory_monitors;
......@@ -10,7 +10,7 @@ namespace DB
class Context;
/** Позволяет создать таблицу по имени движка.
/** Allows you to create a table by the name of the engine.
class StorageFactory : public Singleton<StorageFactory>
......@@ -13,12 +13,12 @@ class Join;
using JoinPtr = std::shared_ptr<Join>;
/** Позволяет сохранить состояние для последующего использования в правой части JOIN.
* При вставке в таблицу, данные будут вставлены в состояние,
* а также записаны в файл-бэкап, для восстановления после перезапуска.
* Чтение из таблицы напрямую невозможно - возможно лишь указание в правой части JOIN.
/** Allows you save the state for later use on the right side of the JOIN.
* When inserted into a table, the data will be inserted into the state,
* and also written to the backup file, to restore after the restart.
* Reading from the table is not possible directly - only specifying on the right side of JOIN is possible.
* При использовании, JOIN должен быть соответствующего типа (ANY|ALL LEFT|INNER ...).
* When using, JOIN must be of the appropriate type (ANY|ALL LEFT|INNER ...).
class StorageJoin : private ext::shared_ptr_helper<StorageJoin>, public StorageSetOrJoinBase
......@@ -43,10 +43,10 @@ public:
String getName() const override { return "Join"; }
/// Получить доступ к внутренностям.
/// Access the innards.
JoinPtr & getJoin() { return join; }
/// Убедиться, что структура данных подходит для осуществления JOIN такого типа.
/// Verify that the data structure is suitable for implementing this type of JOIN.
void assertCompatible(ASTTableJoin::Kind kind_, ASTTableJoin::Strictness strictness_) const;
......@@ -21,22 +21,22 @@ namespace ErrorCodes
/** Смещение до каждой некоторой пачки значений.
* Эти пачки имеют одинаковый размер в разных столбцах.
* Они нужны, чтобы можно было читать данные в несколько потоков.
/** Offsets to every single set of values.
* These sets are the same size in different columns.
* They are needed so that you can read the data in several threads.
struct Mark
size_t rows; /// Сколько строк содержится в этой пачке и всех предыдущих.
size_t offset; /// Смещение до пачки в сжатом файле.
size_t rows; /// How many lines are contained in this set and all previous ones.
size_t offset; /// The offset to the set in the compressed file.
using Marks = std::vector<Mark>;
/** Реализует хранилище, подходящее для логов.
* Ключи не поддерживаются.
* Данные хранятся в сжатом виде.
/** Implements a repository that is suitable for logs.
* Keys are not supported.
* The data is stored in a compressed form.
class StorageLog : private ext::shared_ptr_helper<StorageLog>, public IStorage
......@@ -45,9 +45,9 @@ friend class LogBlockInputStream;
friend class LogBlockOutputStream;
/** Подцепить таблицу с соответствующим именем, по соответствующему пути (с / на конце),
* (корректность имён и путей не проверяется)
* состоящую из указанных столбцов; создать файлы, если их нет.
/** hook the table with the appropriate name, along the appropriate path (with / at the end),
* (the correctness of names and paths is not verified)
* consisting of the specified columns; Create files if they do not exist.
static StoragePtr create(
const std::string & path_,
......@@ -82,11 +82,11 @@ public:
void rename(const String & new_path_to_db, const String & new_database_name, const String & new_table_name) override;
/// Данные столбца
/// Column data
struct ColumnData
/// Задает номер столбца в файле с засечками.
/// Не обязательно совпадает с номером столбца среди столбцов таблицы: здесь нумеруются также столбцы с длинами массивов.
/// Specifies the column number in the marks file.
/// Does not necessarily match the column number among the columns of the table: columns with lengths of arrays are also numbered here.
size_t column_index;
Poco::File data_file;
......@@ -112,12 +112,12 @@ protected:
const ColumnDefaults & column_defaults_,
size_t max_compress_block_size_);
/// Прочитать файлы с засечками, если они ещё не прочитаны.
/// Делается лениво, чтобы при большом количестве таблиц, сервер быстро стартовал.
/// Нельзя вызывать с залоченным на запись rwlock.
/// Read marks files if they are not already read.
/// It is done lazily, so that with a large number of tables, the server starts quickly.
/// You can not call with a write locked `rwlock`.
void loadMarks();
/// Можно вызывать при любом состоянии rwlock.
/// Can be called with any state of `rwlock`.
size_t marksCount();
BlockInputStreams read(
......@@ -143,7 +143,7 @@ private:
void loadMarksImpl(bool load_null_marks);
/// Порядок добавления файлов не должен меняться: он соответствует порядку столбцов в файле с засечками.
/// The order of adding files should not change: it corresponds to the order of the columns in the marks file.
void addFile(const String & column_name, const IDataType & type, size_t level = 0);
bool loaded_marks;
......@@ -157,12 +157,12 @@ protected:
FileChecker file_checker;
/** Для обычных столбцов, в засечках указано количество строчек в блоке.
* Для столбцов-массивов и вложенных структур, есть более одной группы засечек, соответствующих разным файлам:
* - для внутренностей (файла name.bin) - указано суммарное количество элементов массивов в блоке,
* - для размеров массивов (файла name.size0.bin) - указано количество строчек (самих целых массивов) в блоке.
/** For normal columns, the number of rows in the block is specified in the marks.
* For array columns and nested structures, there are more than one group of marks that correspond to different files
* - for insides (file name.bin) - the total number of array elements in the block is specified,
* - for array sizes (file name.size0.bin) - the number of rows (the whole arrays themselves) in the block is specified.
* Вернуть первую попавшуюся группу засечек, в которых указано количество строчек, а не внутренностей массивов.
* Return the first group of marks that contain the number of rows, but not the internals of the arrays.
const Marks & getMarksWithRealRowCount() const;
......@@ -15,10 +15,10 @@ namespace DB
class StorageMemory;
/** Реализует хранилище в оперативке.
* Подходит для временных данных.
* В нём не поддерживаются ключи.
* Данные хранятся в виде набора блоков и никуда дополнительно не сохраняются.
/** Implements storage in the RAM.
* Suitable for temporary data.
* It does not support keys.
* Data is stored as a set of blocks and is not stored anywhere else.
class StorageMemory : private ext::shared_ptr_helper<StorageMemory>, public IStorage
......@@ -63,7 +63,7 @@ private:
String name;
NamesAndTypesListPtr columns;
/// Сами данные. list - чтобы при вставке в конец, существующие итераторы не инвалидировались.
/// The data itself. `list` - so that when inserted to the end, the existing iterators are not invalidated.
BlocksList data;
std::mutex mutex;
......@@ -9,8 +9,8 @@
namespace DB
/** Таблица, представляющая собой объединение произвольного количества других таблиц.
* У всех таблиц должна быть одинаковая структура.
/** A table that represents the union of an arbitrary number of other tables.
* All tables must have the same structure.
class StorageMerge : private ext::shared_ptr_helper<StorageMerge>, public IStorage
......@@ -18,26 +18,26 @@ friend class ext::shared_ptr_helper<StorageMerge>;
static StoragePtr create(
const std::string & name_, /// Имя таблицы.
NamesAndTypesListPtr columns_, /// Список столбцов.
const String & source_database_, /// В какой БД искать таблицы-источники.
const String & table_name_regexp_, /// Регексп имён таблиц-источников.
const Context & context_); /// Известные таблицы.
const std::string & name_, /// The name of the table.
NamesAndTypesListPtr columns_, /// List of columns.
const String & source_database_, /// In which database to look for source tables.
const String & table_name_regexp_, /// Regex names of source tables.
const Context & context_); /// Known tables.
static StoragePtr create(
const std::string & name_, /// Имя таблицы.
NamesAndTypesListPtr columns_, /// Список столбцов.
const std::string & name_, /// The name of the table.
NamesAndTypesListPtr columns_, /// List of columns.
const NamesAndTypesList & materialized_columns_,
const NamesAndTypesList & alias_columns_,
const ColumnDefaults & column_defaults_,
const String & source_database_, /// В какой БД искать таблицы-источники.
const String & table_name_regexp_, /// Регексп имён таблиц-источников.
const Context & context_); /// Известные таблицы.
const String & source_database_, /// In which database to look for source tables.
const String & table_name_regexp_, /// Regex names of source tables.
const Context & context_); /// Known tables.
std::string getName() const override { return "Merge"; }
std::string getTableName() const override { return name; }
/// Проверка откладывается до метода read. Там проверяется поддержка у использующихся таблиц.
/// The check is delayed to the read method. It checks the support of the tables used.
bool supportsSampling() const override { return true; }
bool supportsPrewhere() const override { return true; }
bool supportsFinal() const override { return true; }
......@@ -59,8 +59,8 @@ public:
void drop() override {}
void rename(const String & new_path_to_db, const String & new_database_name, const String & new_table_name) override { name = new_table_name; }
/// в подтаблицах добавлять и удалять столбы нужно вручную
/// структура подтаблиц не проверяется
/// you need to add and remove columns in the sub-tables manually
/// the structure of sub-tables is not checked
void alter(const AlterCommands & params, const String & database_name, const String & table_name, const Context & context) override;
......@@ -533,7 +533,7 @@ void StorageMergeTree::attachPartition(ASTPtr query, const Field & field, bool u
LOG_INFO(log, "Finished attaching part");
/// New parts with other data may appear in place of deleted pieces.
/// New parts with other data may appear in place of deleted parts.
......@@ -14,7 +14,7 @@
namespace DB
/** См. описание структуры данных в MergeTreeData.
/** See the description of the data structure in MergeTreeData.
class StorageMergeTree : private ext::shared_ptr_helper<StorageMergeTree>, public IStorage
......@@ -22,13 +22,13 @@ friend class ext::shared_ptr_helper<StorageMergeTree>;
friend class MergeTreeBlockOutputStream;
/** Подцепить таблицу с соответствующим именем, по соответствующему пути (с / на конце),
* (корректность имён и путей не проверяется)
* состоящую из указанных столбцов.
/** hook the table with the appropriate name, along the appropriate path (with / at the end),
* (correctness of names and paths are not checked)
* consisting of the specified columns.
* primary_expr_ast - выражение для сортировки;
* date_column_name - имя столбца с датой;
* index_granularity - на сколько строчек пишется одно значение индекса.
* primary_expr_ast - expression for sorting;
* date_column_name - the name of the column with the date;
* index_granularity - fow how many rows one index value is written.
static StoragePtr create(
const String & path_,
......@@ -42,7 +42,7 @@ public:
Context & context_,
ASTPtr & primary_expr_ast_,
const String & date_column_name_,
const ASTPtr & sampling_expression_, /// nullptr, если семплирование не поддерживается.
const ASTPtr & sampling_expression_, /// nullptr, if sampling is not supported.
size_t index_granularity_,
const MergeTreeData::MergingParams & merging_params_,
bool has_force_restore_data_flag,
......@@ -85,7 +85,7 @@ public:
BlockOutputStreamPtr write(ASTPtr query, const Settings & settings) override;
/** Выполнить очередной шаг объединения кусков.
/** Perform the next step in combining the parts.
bool optimize(const String & partition, bool final, const Settings & settings) override
......@@ -11,8 +11,8 @@
namespace DB
/** При записи, ничего не делает.
* При чтении, возвращает пустоту.
/** When writing, does nothing.
* When reading, returns nothing.
class StorageNull : private ext::shared_ptr_helper<StorageNull>, public IStorage
......@@ -127,8 +127,8 @@ static const auto MERGE_SELECTING_SLEEP_MS = 5 * 1000;
* Why is this number 200?
* The fact is that previously negative block numbers were not supported.
* And also, the merge is done that way so that when you increase the number of parts, insertion of new parts slows down on purpose,
* until mergers have time to reduce the number of parts; and it was calculated for about 200 pieces.
* So, when you insert all the parts from the other table into the table, 200 numbers are sure enough.
* until mergers have time to reduce the number of parts; and it was calculated for about 200 parts.
* So, when you insert all the parts from the other table into the table, 200 is sure enough.
* In turn, this number is chosen almost at random.
extern const Int64 RESERVED_BLOCK_NUMBERS = 200;
......@@ -2803,7 +2803,7 @@ void StorageReplicatedMergeTree::dropPartition(
String fake_part_name = getFakePartNameForDrop(month_name, left, right);
/** Forbid to choose the parts to be deleted for merging.
* Invariant: after the `DROP_RANGE` entry appears in the log, merge of deleted pieces will not appear in the log.
Invariant: after the `DROP_RANGE` entry appears in the log, merge of deleted parts will not appear in the log.
std::lock_guard<std::mutex> merge_selecting_lock(merge_selecting_mutex);
......@@ -12,7 +12,7 @@ class Set;
using SetPtr = std::shared_ptr<Set>;
/** Общая часть StorageSet и StorageJoin.
/** Common part of StorageSet and StorageJoin.
class StorageSetOrJoinBase : private ext::shared_ptr_helper<StorageSetOrJoinBase>, public IStorage
......@@ -40,24 +40,24 @@ protected:
String name;
NamesAndTypesListPtr columns;
UInt64 increment = 0; /// Для имён файлов бэкапа.
UInt64 increment = 0; /// For the backup file names.
/// Восстановление из бэкапа.
/// Restore from backup.
void restore();
void restoreFromFile(const String & file_path);
/// Вставить блок в состояние.
/// Insert the block into the state.
virtual void insertBlock(const Block & block) = 0;
virtual size_t getSize() const = 0;
/** Позволяет сохранить множество для последующего использования в правой части оператора IN.
* При вставке в таблицу, данные будут вставлены в множество,
* а также записаны в файл-бэкап, для восстановления после перезапуска.
* Чтение из таблицы напрямую невозможно - возможно лишь указание в правой части оператора IN.
/** Lets you save the set for later use on the right side of the IN statement.
* When inserted into a table, the data will be inserted into the set,
* and also written to a file-backup, for recovery after a restart.
* Reading from the table is not possible directly - it is possible to specify only the right part of the IN statement.
class StorageSet : private ext::shared_ptr_helper<StorageSet>, public StorageSetOrJoinBase
......@@ -77,7 +77,7 @@ public:
String getName() const override { return "Set"; }
/// Получить доступ к внутренностям.
/// Access the insides.
SetPtr & getSet() { return set; }
......@@ -14,8 +14,8 @@
namespace DB
/** Реализует хранилище, подходящее для маленьких кусочков лога.
* При этом, хранит все столбцы в одном файле формата Native, с расположенным рядом индексом.
/** Implements a repository that is suitable for small pieces of the log.
* In doing so, stores all the columns in a single Native file, with a nearby index.
class StorageStripeLog : private ext::shared_ptr_helper<StorageStripeLog>, public IStorage
......@@ -24,10 +24,10 @@ friend class StripeLogBlockInputStream;
friend class StripeLogBlockOutputStream;
/** Подцепить таблицу с соответствующим именем, по соответствующему пути (с / на конце),
* (корректность имён и путей не проверяется)
* состоящую из указанных столбцов.
* Если не указано attach - создать директорию, если её нет.
/** hook the table with the appropriate name, along the appropriate path (with / at the end),
* (the correctness of names and paths is not checked)
* consisting of the specified columns.
* If not specified `attach` - create a directory if it does not exist.
static StoragePtr create(
const std::string & path_,
......@@ -59,7 +59,7 @@ public:
bool checkData() const override;
/// Данные файла.
/// Data of the file.
struct ColumnData
Poco::File data_file;
......@@ -14,8 +14,8 @@
namespace DB
/** Реализует хранилище, подходящее для маленьких кусочков лога.
* Отличается от StorageLog отсутствием файлов с засечками.
/** Implements a repository that is suitable for small pieces of the log.
* It differs from StorageLog in the absence of mark files.
class StorageTinyLog : private ext::shared_ptr_helper<StorageTinyLog>, public IStorage
......@@ -24,10 +24,10 @@ friend class TinyLogBlockInputStream;
friend class TinyLogBlockOutputStream;
/** Подцепить таблицу с соответствующим именем, по соответствующему пути (с / на конце),
* (корректность имён и путей не проверяется)
* состоящую из указанных столбцов.
* Если не указано attach - создать директорию, если её нет.
/** hook the table with the appropriate name, along the appropriate path (with / at the end),
* (the correctness of names and paths is not verified)
* consisting of the specified columns.
* If not specified `attach` - create a directory if it does not exist.
static StoragePtr create(
const std::string & path_,
......@@ -61,7 +61,7 @@ public:
bool checkData() const override;
/// Данные столбца
/// Column data
struct ColumnData
Poco::File data_file;
......@@ -29,7 +29,7 @@ public:
const NamesAndTypesList & getColumnsListImpl() const override { return *columns; }
ASTPtr getInnerQuery() const { return inner_query.clone(); };
/// Пробрасывается внутрь запроса и решается на его уровне.
/// It is passed inside the query and solved at its level.
bool supportsSampling() const override { return true; }
bool supportsFinal() const override { return true; }
......@@ -66,7 +66,7 @@ protected:
const ColumnDefaults & column_defaults_);
/// Достать из самого внутреннего подзапроса имя базы данных и таблицы: select_database_name, select_table_name.
/// extract the name of the database and the table from the most internal subquery: `select_database_name, select_table_name`.
void extractDependentTable(const ASTSelectQuery & query);
......@@ -10,7 +10,7 @@ namespace DB
class Context;
/** Реализует системную таблицу databases, которая позволяет получить информацию о всех БД.
/** Implements `databases` system table, which allows you to get information about all databases.
class StorageSystemDatabases : private ext::shared_ptr_helper<StorageSystemDatabases>, public IStorage
......@@ -10,7 +10,7 @@ namespace DB
class Context;
/** Реализует системную таблицу events, которая позволяет получить информацию для профайлинга.
/** Implements `events` system table, which allows you to obtain information for profiling.
class StorageSystemEvents : private ext::shared_ptr_helper<StorageSystemEvents>, public IStorage
......@@ -10,8 +10,8 @@ namespace DB
class Context;
/** Реализует системную таблицу functions, которая позволяет получить список
* всех обычных и агрегатных функций.
/** Implements `functions`system table, which allows you to get a list
* all normal and aggregate functions.
class StorageSystemFunctions : private ext::shared_ptr_helper<StorageSystemFunctions>, public IStorage
......@@ -10,7 +10,7 @@ namespace DB
class Context;
/** Реализует системную таблицу metrics, которая позволяет получить информацию о работе сервера.
/** Implements `metrics` system table, which provides information about the operation of the server.
class StorageSystemMetrics : private ext::shared_ptr_helper<StorageSystemMetrics>, public IStorage
......@@ -10,9 +10,9 @@ namespace DB
class Context;
/** Реализует хранилище для системной таблицы Numbers.
* Таблица содержит единственный столбец number UInt64.
* Из этой таблицы можно прочитать все натуральные числа, начиная с 0 (до 2^64 - 1, а потом заново).
/** Implements a repository for the system table Numbers.
* The table contains the only column number UInt64.
* From this table, you can read all natural numbers, starting from 0 (to 2^64 - 1, and then again).
class StorageSystemNumbers : private ext::shared_ptr_helper<StorageSystemNumbers>, public IStorage
......@@ -10,10 +10,10 @@ namespace DB
class Context;
/** Реализует хранилище для системной таблицы One.
* Таблица содержит единственный столбец dummy UInt8 и единственную строку со значением 0.
* Используется, если в запросе не указана таблица.
* Аналог таблицы DUAL в Oracle и MySQL.
/** Implements storage for the system table One.
* The table contains a single column of dummy UInt8 and a single row with a value of 0.
* Used when the table is not specified in the query.
* Analog of the DUAL table in Oracle and MySQL.
class StorageSystemOne : private ext::shared_ptr_helper<StorageSystemOne>, public IStorage
......@@ -10,7 +10,7 @@ namespace DB
class Context;
/** Реализует системную таблицу processes, которая позволяет получить информацию о запросах, исполняющихся в данный момент.
/** Implements `processes` system table, which allows you to get information about the queries that are currently executing.
class StorageSystemProcesses : private ext::shared_ptr_helper<StorageSystemProcesses>, public IStorage
......@@ -10,7 +10,7 @@ namespace DB
class Context;
/** Реализует системную таблицу replicas, которая позволяет получить информацию о статусе реплицируемых таблиц.
/** Implements `replicas` system table, which provides information about the status of the replicated tables.
class StorageSystemReplicas : private ext::shared_ptr_helper<StorageSystemReplicas>, public IStorage
......@@ -10,7 +10,7 @@ namespace DB
class Context;
/** Реализует системную таблицу replication_queue, которая позволяет посмотреть очереди репликации для реплицируемых таблиц.
/** Implements the `replication_queue` system table, which allows you to view the replication queues for the replicated tables.
class StorageSystemReplicationQueue : private ext::shared_ptr_helper<StorageSystemReplicationQueue>, public IStorage
......@@ -10,7 +10,7 @@ namespace DB
class Context;
/** Реализует системную таблицу tables, которая позволяет получить информацию о всех таблицах.
/** Implements the system table `tables`, which allows you to get information about all tables.
class StorageSystemTables : private ext::shared_ptr_helper<StorageSystemTables>, public IStorage
......@@ -10,7 +10,7 @@ namespace DB
class Context;
/** Реализует системную таблицу zookeeper, которая позволяет просматривать данные в ZooKeeper в целях отладки.
/** Implements `zookeeper` system table, which allows you to view the data in ZooKeeper for debugging purposes.
class StorageSystemZooKeeper : private ext::shared_ptr_helper<StorageSystemZooKeeper>, public IStorage
......@@ -5,8 +5,8 @@
namespace DB
/** Знает имена и типы всех возможных виртуальных столбцов.
* Нужно для движков, перенаправляющих запрос в другие таблицы, не зная заранее, какие в них есть виртуальные столбцы.
/** Knows the names and types of all possible virtual columns.
* It is necessary for engines that redirect a request to other tables without knowing in advance what virtual columns they contain.
class VirtualColumnFactory
......@@ -14,24 +14,24 @@ class IStorage;
using StoragePtr = std::shared_ptr<IStorage>;
/** Интерфейс для табличных функций.
/** Interface for table functions.
* Табличные функции не имеют отношения к другим функциям.
* Табличная функция может быть указана в секции FROM вместо [db.]table
* Табличная функция возвращает временный объект StoragePtr, который используется для выполнения запроса.
* Table functions are not relevant to other functions.
* The table function can be specified in the FROM section instead of the [db.]Table
* The table function returns a temporary StoragePtr object that is used to execute the query.
* Пример:
* Example:
* SELECT count() FROM remote('example01-01-1', merge, hits)
* - пойти на example01-01-1, в БД merge, таблицу hits.
* - go to `example01-01-1`, in `merge` database, `hits` table.
class ITableFunction
/// Получить основное имя функции.
/// Get the main function name.
virtual std::string getName() const = 0;
/// Создать storage в соответствии с запросом
/// Create storage according to the query
virtual StoragePtr execute(ASTPtr ast_function, Context & context) const = 0;
virtual ~ITableFunction() {};
......@@ -6,7 +6,7 @@
namespace DB
/** Позволяет получить табличную функцию по ее имени.
/** Lets you get a table function by its name.
class TableFunctionFactory
......@@ -7,9 +7,9 @@ namespace DB
* merge(db_name, tables_regexp)- создаёт временный StorageMerge.
* Cтруктура таблицы берётся из первой попавшейся таблицы, подходящей под регексп.
* Если такой таблицы нет - кидается исключение.
* merge (db_name, tables_regexp) - creates a temporary StorageMerge.
* The structure of the table is taken from the first table that came up, suitable for regexp.
* If there is no such table, an exception is thrown.
class TableFunctionMerge: public ITableFunction
......@@ -7,11 +7,11 @@ namespace DB
* remote('address', db, table) - создаёт временный StorageDistributed.
* Чтобы получить структуру таблицы, делается запрос DESC TABLE на удалённый сервер.
* Например:
* SELECT count() FROM remote('example01-01-1', merge, hits) - пойти на example01-01-1, в БД merge, таблицу hits.
* В качестве имени хоста может быть указано также выражение, генерирующее множество шардов и реплик - см. ниже.
* remote ('address', db, table) - creates a temporary StorageDistributed.
* To get the table structure, a DESC TABLE request is made to the remote server.
* For example
* SELECT count() FROM remote('example01-01-1', merge, hits) - go to `example01-01-1`, in the merge database, the hits table.
* An expression that generates a lot of shards and replicas can also be specified as the host name - see below.
class TableFunctionRemote : public ITableFunction
......@@ -6,10 +6,10 @@
namespace DB
/* shardByHash(cluster, 'key', db, table) - создаёт временный StorageDistributed,
* используя кластер cluster, и выбирая из него только один шард путём хэширования строки key.
/* shardByHash(cluster, 'key', db, table) - creates a temporary StorageDistributed,
* using the cluster `cluster`, and selecting from it only one shard by hashing the string key.
* Аналогично функции remote, чтобы получить структуру таблицы, делается запрос DESC TABLE на удалённый сервер.
* Similarly to the `remote` function, to get the table structure, a DESC TABLE request is made to the remote server.
class TableFunctionShardByHash : public ITableFunction
......@@ -9,8 +9,8 @@ namespace DB
class Cluster;
class Context;
/// Узнать имена и типы столбцов таблицы на первом попавшемся сервере кластера.
/// Используется для реализации табличной функции remote и других.
/// Find the names and types of the table columns on any server in the cluster.
/// Used to implement the `remote` table function and others.
NamesAndTypesList getStructureOfRemoteTable(
const Cluster & cluster,
const std::string & database,
