Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
2dot5
ClickHouse
提交
8a61f96d
C
ClickHouse
项目概览
2dot5
/
ClickHouse
通知
3
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
C
ClickHouse
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
8a61f96d
编写于
1月 28, 2015
作者:
A
Alexey Milovidov
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
dbms: StorageJoin: development [#METR-2944].
上级
fed642cd
变更
5
隐藏空白更改
内联
并排
Showing
5 changed file
with
247 addition
and
0 deletion
+247
-0
dbms/include/DB/Interpreters/Join.h
dbms/include/DB/Interpreters/Join.h
+7
-0
dbms/include/DB/Storages/StorageJoin.h
dbms/include/DB/Storages/StorageJoin.h
+70
-0
dbms/include/DB/Storages/StorageSet.h
dbms/include/DB/Storages/StorageSet.h
+25
-0
dbms/src/Interpreters/Join.cpp
dbms/src/Interpreters/Join.cpp
+4
-0
dbms/src/Storages/StorageJoin.cpp
dbms/src/Storages/StorageJoin.cpp
+141
-0
未找到文件。
dbms/include/DB/Interpreters/Join.h
浏览文件 @
8a61f96d
...
...
@@ -169,6 +169,13 @@ private:
size_t
max_bytes
;
OverflowMode
overflow_mode
;
/** Защищает работу с состоянием в функциях insertFromBlock и joinBlock.
* Эти функции могут вызываться одновременно из разных потоков только при использовании StorageJoin,
* и StorageJoin вызывает только эти две функции.
* Поэтому остальные функции не защинены.
*/
mutable
Poco
::
RWLock
rwlock
;
void
init
(
Set
::
Type
type_
);
template
<
ASTJoin
::
Strictness
STRICTNESS
,
typename
Maps
>
...
...
dbms/include/DB/Storages/StorageJoin.h
0 → 100644
浏览文件 @
8a61f96d
#pragma once
#include <DB/Storages/IStorage.h>
#include <DB/Interpreters/Join.h>
namespace
DB
{
/** Позволяет сохранить состояние для последующего использования в правой части JOIN.
* При вставке в таблицу, данные будут вставлены в состояние,
* а также записаны в файл-бэкап, для восстановления после перезапуска.
* Чтение из таблицы напрямую невозможно - возможно лишь указание в правой части JOIN.
*
* NOTE: В основном, повторяет StorageSet. Можно обобщить.
*/
class
StorageJoin
:
public
IStorage
{
public:
static
StoragePtr
create
(
const
String
&
path_
,
const
String
&
name_
,
const
Names
&
key_names_
,
ASTJoin
::
Kind
kind_
,
ASTJoin
::
Strictness
strictness_
,
NamesAndTypesListPtr
columns_
,
const
NamesAndTypesList
&
materialized_columns_
,
const
NamesAndTypesList
&
alias_columns_
,
const
ColumnDefaults
&
column_defaults_
)
{
return
(
new
StorageJoin
{
path_
,
name_
,
columns_
,
materialized_columns_
,
alias_columns_
,
column_defaults_
})
->
thisPtr
();
}
String
getName
()
const
override
{
return
"Join"
;
}
String
getTableName
()
const
override
{
return
name
;
}
const
NamesAndTypesList
&
getColumnsListImpl
()
const
override
{
return
*
columns
;
}
BlockOutputStreamPtr
write
(
ASTPtr
query
)
override
;
void
rename
(
const
String
&
new_path_to_db
,
const
String
&
new_database_name
,
const
String
&
new_table_name
)
override
;
/// Получить доступ к внутренностям.
JoinPtr
&
getJoin
()
{
return
join
;
}
private:
String
path
;
String
name
;
NamesAndTypesListPtr
columns
;
UInt64
increment
=
0
;
/// Для имён файлов бэкапа.
JoinPtr
join
;
StorageJoin
(
const
String
&
path_
,
const
String
&
name_
,
const
Names
&
key_names_
,
ASTJoin
::
Kind
kind_
,
ASTJoin
::
Strictness
strictness_
,
NamesAndTypesListPtr
columns_
,
const
NamesAndTypesList
&
materialized_columns_
,
const
NamesAndTypesList
&
alias_columns_
,
const
ColumnDefaults
&
column_defaults_
);
/// Восстановление из бэкапа.
void
restore
();
void
restoreFromFile
(
const
String
&
file_path
,
const
DataTypeFactory
&
data_type_factory
);
};
}
dbms/include/DB/Storages/StorageSet.h
浏览文件 @
8a61f96d
...
...
@@ -7,6 +7,31 @@
namespace
DB
{
/** Общая часть StorageSet и StorageJoin.
*/
class
StorageSetAndJoinBase
:
public
IStorage
{
protected:
String
path
;
String
name
;
NamesAndTypesListPtr
columns
;
UInt64
increment
=
0
;
/// Для имён файлов бэкапа.
String
getTableName
()
const
override
{
return
name
;
}
const
NamesAndTypesList
&
getColumnsListImpl
()
const
override
{
return
*
columns
;
}
void
rename
(
const
String
&
new_path_to_db
,
const
String
&
new_database_name
,
const
String
&
new_table_name
)
override
;
/// Восстановление из бэкапа.
void
restore
();
void
restoreFromFile
(
const
String
&
file_path
,
const
DataTypeFactory
&
data_type_factory
);
virtual
void
insertBlock
(
const
Block
&
block
)
=
0
;
};
/** Позволяет сохранить множество для последующего использования в правой части оператора IN.
* При вставке в таблицу, данные будут вставлены в множество,
* а также записаны в файл-бэкап, для восстановления после перезапуска.
...
...
dbms/src/Interpreters/Join.cpp
浏览文件 @
8a61f96d
...
...
@@ -261,6 +261,8 @@ void Join::insertFromBlockImpl(Maps & maps, size_t rows, const ConstColumnPlainP
bool
Join
::
insertFromBlock
(
const
Block
&
block
)
{
Poco
::
ScopedWriteRWLock
lock
(
rwlock
);
size_t
keys_size
=
key_names_right
.
size
();
ConstColumnPlainPtrs
key_columns
(
keys_size
);
...
...
@@ -530,6 +532,8 @@ void Join::joinBlockImpl(Block & block, Maps & maps)
void
Join
::
joinBlock
(
Block
&
block
)
{
Poco
::
ScopedReadRWLock
lock
(
rwlock
);
if
(
kind
==
ASTJoin
::
Left
&&
strictness
==
ASTJoin
::
Any
)
joinBlockImpl
<
ASTJoin
::
Left
,
ASTJoin
::
Any
,
MapsAny
>
(
block
,
maps_any
);
else
if
(
kind
==
ASTJoin
::
Inner
&&
strictness
==
ASTJoin
::
Any
)
...
...
dbms/src/Storages/StorageJoin.cpp
0 → 100644
浏览文件 @
8a61f96d
#include <DB/Storages/StorageJoin.h>
#include <DB/IO/WriteBufferFromFile.h>
#include <DB/IO/ReadBufferFromFile.h>
#include <DB/IO/CompressedWriteBuffer.h>
#include <DB/IO/CompressedReadBuffer.h>
#include <DB/DataStreams/NativeBlockOutputStream.h>
#include <DB/DataStreams/NativeBlockInputStream.h>
#include <DB/Common/escapeForFileName.h>
namespace
DB
{
class
JoinBlockOutputStream
:
public
IBlockOutputStream
{
public:
JoinBlockOutputStream
(
JoinPtr
&
join_
,
const
String
&
backup_path_
,
const
String
&
backup_tmp_path_
,
const
String
&
backup_file_name_
)
:
join
(
join_
),
backup_path
(
backup_path_
),
backup_tmp_path
(
backup_tmp_path_
),
backup_file_name
(
backup_file_name_
),
backup_buf
(
backup_tmp_path
+
backup_file_name
),
compressed_backup_buf
(
backup_buf
),
backup_stream
(
compressed_backup_buf
)
{
}
void
write
(
const
Block
&
block
)
override
{
join
->
insertFromBlock
(
block
);
backup_stream
.
write
(
block
);
}
void
writeSuffix
()
override
{
backup_stream
.
flush
();
compressed_backup_buf
.
next
();
backup_buf
.
next
();
Poco
::
File
(
backup_tmp_path
+
backup_file_name
).
renameTo
(
backup_path
+
backup_file_name
);
}
private:
JoinPtr
join
;
String
backup_path
;
String
backup_tmp_path
;
String
backup_file_name
;
WriteBufferFromFile
backup_buf
;
CompressedWriteBuffer
compressed_backup_buf
;
NativeBlockOutputStream
backup_stream
;
};
BlockOutputStreamPtr
StorageJoin
::
write
(
ASTPtr
query
)
{
++
increment
;
return
new
JoinBlockOutputStream
(
join
,
path
,
path
+
"tmp/"
,
toString
(
increment
)
+
".bin"
);
}
StorageJoin
::
StorageJoin
(
const
String
&
path_
,
const
String
&
name_
,
NamesAndTypesListPtr
columns_
,
const
NamesAndTypesList
&
materialized_columns_
,
const
NamesAndTypesList
&
alias_columns_
,
const
ColumnDefaults
&
column_defaults_
)
:
IStorage
{
materialized_columns_
,
alias_columns_
,
column_defaults_
},
path
(
path_
+
escapeForFileName
(
name_
)
+
'/'
),
name
(
name_
),
columns
(
columns_
)
{
restore
();
}
void
StorageJoin
::
restore
()
{
Poco
::
File
tmp_dir
(
path
+
"tmp/"
);
if
(
!
tmp_dir
.
exists
())
{
tmp_dir
.
createDirectories
();
return
;
}
constexpr
auto
file_suffix
=
".bin"
;
constexpr
auto
file_suffix_size
=
strlen
(
file_suffix
);
DataTypeFactory
data_type_factory
;
Poco
::
DirectoryIterator
dir_end
;
for
(
Poco
::
DirectoryIterator
dir_it
(
path
);
dir_end
!=
dir_it
;
++
dir_it
)
{
const
auto
&
name
=
dir_it
.
name
();
if
(
dir_it
->
isFile
()
&&
name
.
size
()
>
file_suffix_size
&&
0
==
name
.
compare
(
name
.
size
()
-
file_suffix_size
,
file_suffix_size
,
file_suffix
)
&&
dir_it
->
getSize
()
>
0
)
{
/// Вычисляем максимальный номер имеющихся файлов с бэкапом, чтобы добавлять следующие файлы с большими номерами.
UInt64
file_num
=
parse
<
UInt64
>
(
name
.
substr
(
0
,
name
.
size
()
-
file_suffix_size
));
if
(
file_num
>
increment
)
increment
=
file_num
;
restoreFromFile
(
dir_it
->
path
(),
data_type_factory
);
}
}
}
void
StorageJoin
::
restoreFromFile
(
const
String
&
file_path
,
const
DataTypeFactory
&
data_type_factory
)
{
ReadBufferFromFile
backup_buf
(
file_path
);
CompressedReadBuffer
compressed_backup_buf
(
backup_buf
);
NativeBlockInputStream
backup_stream
(
compressed_backup_buf
,
data_type_factory
);
backup_stream
.
readPrefix
();
while
(
Block
block
=
backup_stream
.
read
())
join
->
insertFromBlock
(
block
);
backup_stream
.
readSuffix
();
/// TODO Добавить скорость, сжатые байты, объём данных в памяти, коэффициент сжатия... Обобщить всё логгирование статистики в проекте.
LOG_INFO
(
&
Logger
::
get
(
"StorageJoin"
),
std
::
fixed
<<
std
::
setprecision
(
2
)
<<
"Loaded from backup file "
<<
file_path
<<
". "
<<
backup_stream
.
getInfo
().
rows
<<
" rows, "
<<
backup_stream
.
getInfo
().
bytes
/
1048576.0
<<
" MiB. "
<<
"Join has "
<<
join
->
getTotalRowCount
()
<<
" unique rows."
);
}
void
StorageJoin
::
rename
(
const
String
&
new_path_to_db
,
const
String
&
new_database_name
,
const
String
&
new_table_name
)
{
/// Переименовываем директорию с данными.
String
new_path
=
new_path_to_db
+
escapeForFileName
(
new_table_name
);
Poco
::
File
(
path
).
renameTo
(
new_path
);
path
=
new_path
+
"/"
;
name
=
new_table_name
;
}
}
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录