diff --git a/doc/reference_en.html b/doc/reference_en.html index 20438161e0519d29a6d1a785a7889bcf37575dfd..6c11f266cbd2a2c0cd9c7151202974d821af3ca4 100644 --- a/doc/reference_en.html +++ b/doc/reference_en.html @@ -2176,7 +2176,7 @@ This is more optimal than using the normal IN. However, keep the following point 2. The temporary table will be sent to all the remote servers. Transmission does not account for network topology. For example, if 10 remote servers reside in a datacenter that is very remote in relation to the requestor server, the data will be sent 10 times over the channel to the remote datacenter. Try to avoid large data sets when using %%GLOBAL IN%%. 3. When transmitting data to remote servers, restrictions on network bandwidth are not configurable. You might overload the network. 4. Try to distribute data across servers so that you don't need to use %%GLOBAL IN%% on a regular basis. -5. If you need to use %%GLOBAL IN%% often, plan the location of the ClickHouse cluster so that a single group of replicas resides in no more than one data center, and there is a fast network between them. +5. If you need to use %%GLOBAL IN%% often, plan the location of the ClickHouse cluster so that in each datacenter, there will be at least one replica of each shard, and there is a fast network between them - for possibility to process query with transferring data only inside datacenter. It also makes sense to specify a local table in the %%GLOBAL IN%% clause, in case this local table is only available on the requestor server and you want to use data from it on remote servers. diff --git a/doc/reference_ru.html b/doc/reference_ru.html index 756adab4320355c905ff4c638520f88c3242beab..bf5d7411ef5e446e32813d062221e87424e6dcb0 100644 --- a/doc/reference_ru.html +++ b/doc/reference_ru.html @@ -2228,7 +2228,7 @@ ORDER BY EventDate ASC 2. Временная таблица будет передана на все удалённые серверы. Передача не учитывает топологию сети. Например, если 10 удалённых серверов расположены в удалённом относительно сервера-инициатора запроса датацентре, то по каналу в удалённый датацентр данные будет переданы 10 раз. Старайтесь не использовать большие множества при использовании %%GLOBAL IN%%. 3. При передаче данных на удалённые серверы не настраивается ограничение использования сетевой полосы. Вы можете перегрузить сеть. 4. Старайтесь распределять данные по серверам так, чтобы в %%GLOBAL IN%%-ах не было частой необходимости. -5. Если в %%GLOBAL IN%% есть частая необходимость, то спланируйте размещение кластера ClickHouse таким образом, чтобы одна группа реплик располагалась не более чем в одном датацентре, и среди них была быстрая сеть. +5. Если в %%GLOBAL IN%% есть частая необходимость, то спланируйте размещение кластера ClickHouse таким образом, чтобы в каждом датацентре была хотя бы одна реплика каждого шарда, и среди них была быстрая сеть - чтобы запрос целиком можно было бы выполнить, передавая данные в пределах одного датацентра. В секции %%GLOBAL IN%% также имеет смысл указывать локальную таблицу - в случае, если эта локальная таблица есть только на сервере-инициаторе запроса, и вы хотите воспользоваться данными из неё на удалённых серверах.