# classification 物体识别分类 ## 项目介绍 该项目对物体进行识别分类。 ## 项目配置 * 作者开发环境: * Python 3.7 * PyTorch >= 1.5.1 ## 数据集 ### 1、Stanford Dogs 数据集 * 采用"Stanford Dogs Dataset"数据集官方地址:http://vision.stanford.edu/aditya86/ImageNetDogs/ * 本文将该数据集的标注文件更改为xml格式,[数据集下载地址(百度网盘 Password: ks87 )](https://pan.baidu.com/s/1tT0wF4N2I9p5JDfCwtM1CQ) * 通过运行read_datasests.py,可以对数据的标注信息进行解析可视化。 * 该数据集分为 120 类 。 ### 2、静态手势识别数据集(handpose_x_gesture_v1) ![video_gesture](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/gesture.gif) * 数据集来源3部分,且网上数据占绝大多数,具体: * 1)来源于网上数据并自制。 * 2)来源于自己相机采集并自制。 * 3)来源于 kinect_leap_dataset 数据集并自制,其官网地址为:https://lttm.dei.unipd.it/downloads/gesture/ * 注:数据集如有侵权,请联系删除。 ``` kinect_leap_dataset 数据集来源于以下paper项目组的贡献。 [1] G. Marin, F. Dominio, P. Zanuttigh, "Hand gesture recognition with Leap Motion and Kinect devices", IEEE International Conference on Image Processing (ICIP), Paris, France, 2014 [2] G. Marin, F. Dominio, P. Zanuttigh, "Hand Gesture Recognition with Jointly Calibrated Leap Motion and Depth Sensor", Multimedia Tools and Applications, 2015 ``` * 数据下载 该项目数据集命名为:handpose_x_gesture_v1,[数据集下载地址(百度网盘 Password: psi1 )](https://pan.baidu.com/s/10jN4DOYcu9Pfv6gd5c3y4A) 数据集共 2850 个样本,分为 14 类。 * 手势定义 ![one](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/one.jpg) :000-one ![five](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/five.jpg) :001-five ![fist](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/fist.jpg) :002-fist ![ok](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/ok.jpg) :003-ok ![heartSingle](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/heartSingle.jpg) :004-heartSingle ![yearh](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/yearh.jpg) :005-yearh ![three](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/three.jpg) :006-three ![four](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/four.jpg) :007-four ![six](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/six.jpg) :008-six ![Iloveyou](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/Iloveyou.jpg) :009-Iloveyou ![gun](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/gun.jpg) :010-gun ![thumbUp](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/thumbUp.jpg) :011-thumbUp ![nine](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/nine.jpg) :012-nine ![pink](https://codechina.csdn.net/EricLee/classification/-/raw/master/samples/pink.jpg) :013-pink ## 预训练模型 ### 1、Stanford Dogs 预训练模型 * [预训练模型下载地址(百度网盘 Password: ks87 )](https://pan.baidu.com/s/1tT0wF4N2I9p5JDfCwtM1CQ) ### 2、静态手势识别预训练模型(handpose_x_gesture_v1) * [预训练模型下载地址(百度网盘 Password: igcf )](https://pan.baidu.com/s/1WeoYQ3bfTkpbzPbROm81Ew) ## 项目使用方法 ### 模型训练 * 根目录下运行命令: python train.py (注意脚本内相关参数配置 ) ### 模型推理 * 根目录下运行命令: python inference.py (注意脚本内相关参数配置 ) ### 注意事项 * 因为数据集的整张图会有大量背景、多只狗等干扰因素。本文采用的图像输入是"Stanford Dogs Dataset"数据集的目标边界框范围图像,这样也觉定了在模型推断预测环境下也是以目标物的边界框为范围的图像作为输入。 ## 联系方式 (Contact) * E-mails: 305141918@qq.com