Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
VisualDL
提交
b15aa0fe
V
VisualDL
项目概览
PaddlePaddle
/
VisualDL
大约 1 年 前同步成功
通知
88
Star
4655
Fork
642
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
10
列表
看板
标记
里程碑
合并请求
2
Wiki
5
Wiki
分析
仓库
DevOps
项目成员
Pages
V
VisualDL
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
10
Issue
10
列表
看板
标记
里程碑
合并请求
2
合并请求
2
Pages
分析
分析
仓库分析
DevOps
Wiki
5
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
b15aa0fe
编写于
1月 16, 2018
作者:
A
abigale Li
提交者:
GitHub
1月 16, 2018
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
modify the data structure doc and delete the visualization doc (#164)
上级
6dffdeb6
变更
2
隐藏空白更改
内联
并排
Showing
2 changed file
with
22 addition
and
31 deletion
+22
-31
docs/data_structure.md
docs/data_structure.md
+22
-22
docs/visualization.md
docs/visualization.md
+0
-9
未找到文件。
docs/data_structure.md
浏览文件 @
b15aa0fe
#
数据格式抽象
#
基础可视化组件
初版
需要支持如下几种基础
组件:
初版
支持如下几种基础可视化
组件:
-
基本
组件
-
可视化
组件
-
scalar
-
histogram
-
image
-
audio
-
text
-
高级组件
-
graph
下面将对这些组件的数据类型进行抽象。
# 宏观信息
后端的日志会在每个周期追加到
`logdir`
中相应的
log
文件中,在追加信息的过程中,
除了
graph,其他所有组件均需要时间步等信息,依次下面列出这个过程
必须的一些元信息:
后端的日志会在每个周期追加到
`logdir`
中相应的
log
文件中,在追加信息的过程中,
除了
graph,其他所有组件均需要时间步等信息,下面依次列出这个过程中
必须的一些元信息:
-
`step_id`
追加的时间步
-
`UNIX time`
方便追踪速度
-
`tag`
类似TF,每个参与可视化的信息来源必须有一个唯一的命名(可以系统自动生成)
-
tag
会作为特定数据流从前端到后端统一的标识
-
`tag`
类似
TF,每个参与可视化的信息来源必须有一个唯一的命名(可以系统自动生成)
-
tag
会作为特定数据流从前端到后端统一的标识,如
`layer1/loss`
.
# 各组件数据抽象
这里会抽象各组件数据必须存储的信息,为了便于沟通,使用了类似
`JSON`
的格式,
实际使用中,前后端可以自由选择数据格式,以及数据压缩。
## 抽样
每个
`tag`
会对应一个
log
文件,其中会包含全量信息(可以优化),但前端可视化并不需要全量信息,
每个
`tag`
会对应一个
log
文件,其中会包含全量信息(可以优化),但前端可视化并不需要全量信息,
这里后端就可以用
`蓄水池抽样`
来对全量数据进行抽样,组织好数据push给前端。
## 增量更新数据
考虑到前端可视化的动态更新,
当前后端的全量数据应该只在第一次访问时才需要push给前端,
考虑到前端可视化的动态更新,
后端的全量数据应该只在第一次访问时才需要push给前端。
中间状态,后端前端交互的都只需要传递增量数据,具体增量数据格式类似
```
javascript
...
...
@@ -42,9 +39,8 @@
]
```
## 统一的数据表示
上述除了
group
之外的所有组件的数据,都可以用下述数据格式表示
上述除了
graph
之外的所有组件的数据,都可以用下述数据格式表示
```
[
...
...
@@ -59,7 +55,7 @@
]
// meta info
[
// one of image
, text, audio, scalar or histogram
// one of image
"type": "image",
"size": [320, 270],
"tag": "some-name"
...
...
@@ -87,8 +83,7 @@
当然,上面的数据格式在最终存储时,可以折叠为
```
```
javascript
[
[
23323
,
23
],
[
23325
,
13
]
...
...
@@ -97,7 +92,7 @@
这里只关注必要的信息,具体的优化暂不考虑,后续不再赘述。
## histogram
histogram 需要得到
tensor的分布,因此会把完整的
tensor 的数值存下,具体的分布可以后端实时(增量)计算
histogram 需要得到
tensor 的分布,因此会把完整的
tensor 的数值存下,具体的分布可以后端实时(增量)计算
后端存储的数据格式
...
...
@@ -105,23 +100,28 @@ histogram 需要得到tensor的分布,因此会把完整的tensor 的数值存
[
[
"
step_id
"
:
12
,
"
unix_time
"
:
23326
,
"
data
"
:
[
0.12
,
0.37
,
...]
],
[
"
step_id
"
:
13
,
"
unix_time
"
:
23337
,
"
data
"
:
[
0.13
,
0.38
,
...]
]
]
```
后端会计算好每个时间步的数据分布
push
给前端,具体数据格式如下
后端会计算好每个时间步的数据分布
push
给前端,具体数据格式如下
```
javascript
[
[
"
step_id
"
:
12
,
// time
23326
,
// step_id
12
,
// n-dim distribution
"
data
"
:
[
0.12
,
0.23
,
...]
[
0.12
,
0.23
,
...]
]
]
```
...
...
@@ -150,7 +150,7 @@ histogram 需要得到tensor的分布,因此会把完整的tensor 的数值存
```
## text
后端直接生成 text便可
后端直接生成 text
便可
```
javascript
[
...
...
docs/visualization.md
已删除
100644 → 0
浏览文件 @
6dffdeb6
# 可视化哪些信息(参数)
# 可视化形式
# 交互设计
# 前端增量
# 前端采样
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录