From d3f9a80748fde15ac007c053e3ca1707bbf94a91 Mon Sep 17 00:00:00 2001 From: dengkaipeng Date: Fri, 1 Mar 2019 20:25:54 +0800 Subject: [PATCH] add models README --- README.md | 1 + fluid/PaddleCV/video/README.md | 14 +++++--------- 2 files changed, 6 insertions(+), 9 deletions(-) diff --git a/README.md b/README.md index 76b5a6f7..c8626880 100644 --- a/README.md +++ b/README.md @@ -36,6 +36,7 @@ PaddlePaddle 提供了丰富的计算单元,使得用户可以采用模块化 [Attention模型](https://github.com/PaddlePaddle/models/tree/develop/fluid/PaddleCV/ocr_recognition)|场景文字识别模型|使用attention 识别图片中单行英文字符|[Recurrent Models of Visual Attention](https://arxiv.org/abs/1406.6247) [Metric Learning](https://github.com/PaddlePaddle/models/tree/develop/fluid/PaddleCV/metric_learning)|度量学习模型|能够用于分析对象时间的关联、比较关系,可应用于辅助分类、聚类问题,也广泛用于图像检索、人脸识别等领域|- [TSN](https://github.com/PaddlePaddle/models/tree/develop/fluid/PaddleCV/video_classification)|视频分类模型|基于长范围时间结构建模,结合了稀疏时间采样策略和视频级监督来保证使用整段视频时学习得有效和高效|[Temporal Segment Networks: Towards Good Practices for Deep Action Recognition](https://arxiv.org/abs/1608.00859) +[视频模型库](https://github.com/PaddlePaddle/models/tree/develop/fluid/PaddleCV/video)|视频模型库|给开发者提供基于PaddlePaddle的便捷、高效的使用深度学习算法解决视频理解、视频编辑、视频生成等一系列模型|| [caffe2fluid](https://github.com/PaddlePaddle/models/tree/develop/fluid/PaddleCV/caffe2fluid)|将Caffe模型转换为Paddle Fluid配置和模型文件工具|-|- ## PaddleNLP diff --git a/fluid/PaddleCV/video/README.md b/fluid/PaddleCV/video/README.md index cbb96783..bf0f27c5 100644 --- a/fluid/PaddleCV/video/README.md +++ b/fluid/PaddleCV/video/README.md @@ -1,10 +1,3 @@ -# Paddle视频模型库 - ---- - -## 安装 - -在当前模型库运行样例代码需要PadddlePaddle Fluid v.1.2.0或以上的版本。如果你的运行环境中的PaddlePaddle低于此版本,请根据[安装文档](http://www.paddlepaddle.org/documentation/docs/zh/1.3/beginners_guide/install/index_cn.html)中的说明来更新PaddlePaddle。 ## 简介 本教程期望给开发者提供基于PaddlePaddle的便捷、高效的使用深度学习算法解决视频理解、视频编辑、视频生成等一系列模型。目前包含视频分类模型,后续会不断的扩展到其他更多场景。 @@ -19,6 +12,9 @@ | [StNet](./models/stnet/README.md) [[论文](https://arxiv.org/abs/1811.01549)] | 视频分类| AAAI'19提出的视频联合时空建模方法 | | [TSN](./models/tsn/README.md) [[论文](https://arxiv.org/abs/1608.00859)] | 视频分类| ECCV'16提出的基于2D-CNN经典解决方案 | +## 安装 + +在当前模型库运行样例代码需要PadddlePaddle Fluid v.1.2.0或以上的版本。如果你的运行环境中的PaddlePaddle低于此版本,请根据[安装文档](http://www.paddlepaddle.org/documentation/docs/zh/1.3/beginners_guide/install/index_cn.html)中的说明来更新PaddlePaddle。 ## 数据准备 @@ -58,7 +54,7 @@ bash scripts/train/train_stnet.sh ## Model Zoo -使用Youtube-8M数据集模型如下: +- 基于Youtube-8M数据集模型: | 模型 | Batch Size | 环境配置 | cuDNN版本 | GAP | 下载链接 | | :-------: | :---: | :---------: | :-----: | :----: | :----------: | @@ -66,7 +62,7 @@ bash scripts/train/train_stnet.sh | Attention LSTM | 1024 | 8卡P40 | 7.1 | 0.86 | [model](https://paddlemodels.bj.bcebos.com/video_classification/attention_lstm_youtube8m.tar.gz) | | NeXtVLAD | 160 | 4卡P40 | 7.1 | 0.87 | [model](https://paddlemodels.bj.bcebos.com/video_classification/nextvlad_youtube8m.tar.gz) | -使用Kinetics数据集模型如下: +- 基于Kinetics数据集模型: | 模型 | Batch Size | 环境配置 | cuDNN版本 | Top-1 | 下载链接 | | :-------: | :---: | :---------: | :----: | :----: | :----------: | -- GitLab