博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
视频图像处理
阅读量:2756 次
发布时间:2019-05-13

本文共 567 字,大约阅读时间需要 1 分钟。

为什么要采用这样的网络?

众所周知的CNN网络对于图像的空间域的处理具有很好的效果,在单张图像的分类分割目标检测等问题上表现出了很好的效果。很多人或许有和我之前一样的疑问,既然单张图像上做的效果已经达到state-of-art的效果,为什么还要联系时间域上的信息呢?直接将视频序列拆分成单帧图像进行处理不就可以了麽?

其实理解时间域的优势并不在于如何提高算法的效果,而是在于充分利用已有视频的信息,在有限的视频训练数据集上达到更好的效果。

简单来说,我们当前的任务是对于某一段视频序列中出现的行人进行分割。如果采用单帧图像进行分割操作,需要绞尽脑汁充分开发CNN各方面的性能,以保证仅仅通过行人的 appearance 的角度就可以达到准确的分割。往往这样的单帧图像的训练方法需要(假设)2000张具有人为标注的训练集图像。然而如果在考虑单张图像 appearance 的角度进一步融合行人的 motion 信息,如运动的规律性一致性等等,可能仅仅需要 1000 张具有人为标注的训练集图像。

所以并不是说单帧图像仅仅考虑 appearance 信息不能完成视频序列的分割,我们采用 sptio-temporal 的构架方法能够在 limited 的有标记的数据集上,充分开发CNN的性能,达到 state-of-art 的分割效果。

转载地址:http://aagad.baihongyu.com/

你可能感兴趣的文章
Filtering ListView with custom (object) adapter
查看>>
onWindowFocusChanged重要作用 and Activity生命周期
查看>>
不再依赖A*,利用C++编写全新寻路算法
查看>>
浅谈状态压缩的应用
查看>>
linux shell编程控制结构:expr、let、for、while、until、shift、if、case、break、continue、函数、select 学习笔记
查看>>
【算法小积累】 - 提取非0数最右侧的1
查看>>
MQTT---HiveMQ源码详解(十二)Netty-MQTT消息、事件处理(流程)
查看>>
MQTT---HiveMQ源码详解(十三)Netty-MQTT消息、事件处理(源码举例解读)
查看>>
MQTT---HiveMQ源码详解(十五)Persistence-Cluster/Single
查看>>
MQTT---HiveMQ源码详解(十六)TopicTree
查看>>
MQTT---HiveMQ源码详解(十七)Cluster-Consistent Hashing Ring & Node Lifecycle
查看>>
MQTT---HiveMQ源码详解(十八)Cluster-kryo与Serializer
查看>>
MQTT---HiveMQ源码详解(十九)Cluster-Request/Response
查看>>
C/C++的mem函数和strcpy函数的区别和应用
查看>>
如何用Eclipse for C++来查看ns中的代码关联关系
查看>>
linux重启网络的命令
查看>>
如何运行Python脚本
查看>>
如何在Word分栏状态下正确的输入脚注?
查看>>
电脑不能录音问题解决
查看>>
几种用于WSN的仿真工具
查看>>