评论:基于Youtube
内容简介:简介 首先对于视频和图片分类的区别,我的理解就是视频分类多了一些时间信息。另一方面对于视频分类包括的场景和动作这两类视频分类中,感觉时域信息的重要性也不同。动作分类更加注重时域信息这一点。总之,为了在普通的多张空域图像信息上提取时域信息,通常处理方法有:双流卷积(普通图像的空域信息加上几张图片的光流信息)、循环神经网络RCNN(包括主流的LSTM等)、3D卷积等。无论何种方法...
用户评论