Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
2dot5
ClickHouse
提交
f740334e
C
ClickHouse
项目概览
2dot5
/
ClickHouse
通知
3
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
C
ClickHouse
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
体验新版 GitCode,发现更多精彩内容 >>
提交
f740334e
编写于
6月 26, 2019
作者:
A
alesapin
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Faster scheme search
Add docs
上级
bd56f219
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
13 addition
and
41 deletion
+13
-41
dbms/src/Functions/URL/domain.h
dbms/src/Functions/URL/domain.h
+11
-39
docs/en/query_language/functions/url_functions.md
docs/en/query_language/functions/url_functions.md
+1
-1
docs/ru/query_language/functions/url_functions.md
docs/ru/query_language/functions/url_functions.md
+1
-1
未找到文件。
dbms/src/Functions/URL/domain.h
浏览文件 @
f740334e
...
...
@@ -4,7 +4,7 @@
#include <common/find_symbols.h>
#include <cstring>
#include <Common/StringUtils/StringUtils.h>
#include <Common/StringSearcher.h>
namespace
DB
{
...
...
@@ -12,6 +12,8 @@ namespace DB
namespace
{
const
ASCIICaseSensitiveStringSearcher
SCHEME_SEARCHER
{
"://"
,
3
};
inline
StringRef
checkAndReturnHost
(
const
Pos
&
pos
,
const
Pos
&
dot_pos
,
const
Pos
&
start_of_host
)
{
if
(
!
dot_pos
||
start_of_host
>=
pos
||
pos
-
dot_pos
==
1
)
...
...
@@ -33,45 +35,15 @@ inline StringRef getURLHost(const char * data, size_t size)
Pos
end
=
data
+
size
;
if
(
*
pos
==
'/'
&&
*
(
pos
+
1
)
==
'/'
)
{
pos
+=
2
;
else
if
(
isAlphaASCII
(
*
pos
))
/// Slightly modified getURLScheme
}
else
{
for
(
++
pos
;
pos
<
end
;
++
pos
)
{
if
(
!
isAlphaNumericASCII
(
*
pos
))
{
switch
(
*
pos
)
{
case
'.'
:
case
'-'
:
case
'+'
:
break
;
case
' '
:
/// restricted symbols
case
'\t'
:
case
'<'
:
case
'>'
:
case
'%'
:
case
'{'
:
case
'}'
:
case
'|'
:
case
'\\'
:
case
'^'
:
case
'~'
:
case
'['
:
case
']'
:
case
';'
:
case
'='
:
case
'&'
:
return
StringRef
{};
default:
goto
exit_loop
;
}
}
}
exit_loop:
if
(
end
-
pos
>
2
&&
*
pos
==
':'
&&
*
(
pos
+
1
)
==
'/'
&&
*
(
pos
+
2
)
==
'/'
)
pos
+=
3
;
else
pos
=
data
;
size_t
max_scheme_size
=
std
::
min
(
size
,
16UL
);
Pos
scheme_end
=
reinterpret_cast
<
Pos
>
(
SCHEME_SEARCHER
.
search
(
reinterpret_cast
<
const
UInt8
*>
(
data
),
max_scheme_size
));
if
(
scheme_end
!=
data
+
max_scheme_size
)
pos
=
scheme_end
+
3
;
}
Pos
dot_pos
=
nullptr
;
...
...
@@ -91,7 +63,7 @@ exit_loop: if (end - pos > 2 && *pos == ':' && *(pos + 1) == '/' && *(pos + 2) =
case
'@'
:
/// myemail@gmail.com
start_of_host
=
pos
+
1
;
break
;
case
' '
:
/// restricted symbols
case
' '
:
/// restricted symbols
in whole URL
case
'\t'
:
case
'<'
:
case
'>'
:
...
...
docs/en/query_language/functions/url_functions.md
浏览文件 @
f740334e
...
...
@@ -12,7 +12,7 @@ Returns the protocol. Examples: http, ftp, mailto, magnet...
### domain
Gets the domain.
Gets the domain.
Cut scheme by substring '://'. Size of cutted scheme is less than 16 bytes. Scheme correctness is not checked.
### domainWithoutWWW
...
...
docs/ru/query_language/functions/url_functions.md
浏览文件 @
f740334e
...
...
@@ -10,7 +10,7 @@
Возвращает протокол. Примеры: http, ftp, mailto, magnet...
### domain
Возвращает домен.
Возвращает домен.
Отсекает схему по подстроке '://'. Размер схемы не более 16 байт. Корректность схемы не проверяется.
### domainWithoutWWW
Возвращает домен, удалив не более одного 'www.' с начала, если есть.
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录