add readme for nonlocal dataset

7265a185 · SunGaofeng · 4442d9c2 · 7265a185 · 7265a185 · 7265a185
4 changed file
--- a/PaddleCV/video/README.md
+++ b/PaddleCV/video/README.md
@@ -12,11 +12,11 @@
 | [StNet](./models/stnet/README.md)  | 视频分类| AAAI'19提出的视频联合时空建模方法 |
 | [TSM](./models/tsm/README.md) | 视频分类| |
 | [TSN](./models/tsn/README.md) | 视频分类| ECCV'16提出的基于2D-CNN经典解决方案 |
-| [NONLOCAL](./models/nonlocal_model/README.md) | 视频分类|  |
+| [Non-local](./models/nonlocal_model/README.md) | 视频分类|  |

 ### 主要特点

- 包含视频分类方向的多个主流领先模型，其中Attention LSTM，Attention Cluster和NeXtVLAD是比较流行的特征序列模型，TSN, TSM和StNet是End-to-End的视频分类模型。Attention LSTM模型速度快精度高，NeXtVLAD是2nd-Youtube-8M比赛中最好的单模型, TSN是基于2D-CNN的经典解决方案。Attention Cluster和StNet是百度自研模型，分别发表于CVPR2018和AAAI2019，是Kinetics600比赛第一名中使用到的模型。
+- 包含视频分类方向的多个主流领先模型，其中Attention LSTM，Attention Cluster和NeXtVLAD是比较流行的特征序列模型，Non-local, TSN, TSM和StNet是End-to-End的视频分类模型。Attention LSTM模型速度快精度高，NeXtVLAD是2nd-Youtube-8M比赛中最好的单模型, TSN是基于2D-CNN的经典解决方案。Attention Cluster和StNet是百度自研模型，分别发表于CVPR2018和AAAI2019，是Kinetics600比赛第一名中使用到的模型。

 - 提供了适合视频分类任务的通用骨架代码，用户可一键式高效配置模型完成训练和评测。


--- a/PaddleCV/video/dataset/README.md
+++ b/PaddleCV/video/dataset/README.md
@@ -2,6 +2,7 @@

 - [Youtube-8M](#Youtube-8M数据集)
 - [Kinetics](#Kinetics数据集)
+- [Non-local](#Non-local)

 ## Youtube-8M数据集
 这里用到的是YouTube-8M 2018年更新之后的数据集。使用官方数据集，并将TFRecord文件转化为pickle文件以便PaddlePaddle使用。Youtube-8M数据集官方提供了frame-level和video-level的特征，这里只需使用到frame-level的特征。
@@ -117,3 +118,6 @@ ActivityNet官方提供了Kinetics的下载工具，具体参考其[官方repo ]

 即可生成相应的文件列表，train.list和val.list的每一行表示一个pkl文件的绝对路径。

+## Non-local
+
+Non-local模型也使用kinetics数据集，不过其数据处理方式和其他模型不一样，详细内容见[Non-local数据说明](./nonlocal/README.md)
--- a/PaddleCV/video/dataset/nonlocal/README.md
+++ b/PaddleCV/video/dataset/nonlocal/README.md
+# Non-local模型数据说明
+
+在Non-local模型中，输入数据是mp4文件，在datareader部分的代码中，使用opencv读取mp4文件对视频进行解码和采样。train和valid数据随机选取起始帧的位置，对每帧图像做随机增强，短边缩放至[256, 320]之间的某个随机数，长边根据长宽比计算出来，截取出224x224大小的区域。test时每条视频会选取10个不同的位置作为起始帧，同时会选取三个不同的空间位置作为crop区域的起始点，这样每个视频会进行10x3次采样，对这30个样本的预测概率求和，选取概率最大的分类作为最终的预测结果。
+
+## 数据下载
+
+下载kinetics400数据，具体方法见[数据说明](../README.md)中kinetics数据部分，假设下载的mp4文件存放在DATADIR目录下，train和validation数据分别位于$DATADIR/train和$DATADIR/valid目录。在下载数据的时候，将所有视频的高度缩放至256，宽度通过长宽比计算出来。
+
+## 下载官方数据列表
+
+将官方提供的数据集文件表格[kinetics-400\_train.csv](https://github.com/activitynet/ActivityNet/tree/master/Crawler/Kinetics/data/kinetics-400_train.csv)和[kinetics-400\_val.csv](https://github.com/activitynet/ActivityNet/tree/master/Crawler/Kinetics/data/kinetics-400_val.csv)下载到此目录。
+
+## 生成文件列表
+
+打开generate\_list.sh，将其中的TRAIN\_DIR和VALID\_DIR修改成用户所保存的mp4文件路径，运行脚本
+
+    bash generate_list.sh
+
+即可生成trainlist.txt、vallist.txt和testlist.txt。
--- a/PaddleCV/video/dataset/nonlocal/generate_list.sh
+++ b/PaddleCV/video/dataset/nonlocal/generate_list.sh
@@ -2,8 +2,8 @@
 TRAINLIST_DOWNLOAD="kinetics-400_train.csv"

 # path of the train and valid data
-TRAIN_DIR="/home/sungaofeng/docker/dockermount/data/compress/train_256"
-VALID_DIR="/home/sungaofeng/docker/dockermount/data/compress/val_256"
+TRAIN_DIR=YOUR_TRAIN_DATA_DIR # replace this with your train data dir
+VALID_DIR=YOUR_VALID_DATA_DIR # replace this with your valid data dir

 python generate_filelist.py $TRAINLIST_DOWNLOAD $TRAIN_DIR $VALID_DIR trainlist.txt vallist.txt