时空上下文视觉跟踪(STC)算法的解读与代码复现.docx
《时空上下文视觉跟踪(STC)算法的解读与代码复现.docx》由会员分享,可在线阅读,更多相关《时空上下文视觉跟踪(STC)算法的解读与代码复现.docx(14页珍藏版)》请在第一文库网上搜索。
1、时空上下文视觉跟踪(STC)算法的解读与代码复现zouxy09zouxy09本博文主要是关注一篇视觉跟踪的论文。这篇论文是KaihUaZhang等人今年投稿到一个会议的文章,因为会议还没有出结果,所以作者还没有发布他的MatIab源代码。但为了让我们先睹为快,作者把论文放在arxiv这个网站上面供大家下载了。对于里面所描述的神奇的效果,大家都跃跃欲试,也有人将其复现了。我这里也花了一天的时间去免现了单尺度的C+版本,主要是基于OPeneV。多尺度的有点复杂,这个后面再做考虑了。另外,能力有限,论文解读和代码实现可能会出现错误,所以如果代码里面出现错误,还望大家不吝指点。论文见:KaihuaZh
2、ang,1eiZhang,Ming-HsuanYang,andDavidZhang,FastTrackingviaSpatio-Tempora1Context1earning目前作者已公开了支持多尺度的MatIab代码了哦。可以到以下网址下载:p.po1yu.edu.hk/-cs1zhang/STC/STC.htm一、概述该论文提出一种简单却非常有效的视觉跟踪方法。更迷人的一点是,它速度很快,原作者实现的Mat1ab代码在i7的电脑上达到350fps(.该论文的关键点是对时空上下文(Spatio-Tempora1Context)信息的利用。主要思想是通过贝叶斯框架对要跟踪的目标和它的局部上下文
3、区域的时空关系进行建模,得到目标和其周围区域低级特征的统计相关性。然后综合这一时空关系和生物视觉系统上的focusofattention特性来评估新的一帧中目标出现位置的置信图,置信最大的位置就是我们得到的新的一帧的目标位置。另外,时空模型的学习和目标的检测都是通过FFT(傅里叶变换)来实现,所以学习和检测的速度都比较快。二、工作过程具体过程见下图:Frame(t)FocusofattentionSpatia1contextmode1卡(a)1cam1U!COatCX111theMhframe(b)DcicciobjectIOca1iOathe(t+1)(hIhmc(1)t帧:在该帧目标(第一
4、帧由人工指定)己经知道的情况下,我们计算得到一个目标的置信图(ConfidenceMap,也就是目标的似然)。通过生物视觉系统上的focusOfattention特性我们可以得到另一张概率图(先验概率)。通过对这两个概率图的傅里叶变换做除再反傅里叶变换,就可以得到建模目标和周围背景的空间相关性的空间上下文模型(条件概率)。然后我们用这个模型去更新跟踪下一帧需要的时空上下文模型(可能这里还不太能理解,看到后面的相关理论分析和算法描述后可能会清晰一点)。(2)t+1帧:利用t帧的上下文信息(时空上下文模型),卷积图像得到一个目标的置信图,值最大的位置就是我们的目标所在地。或者理解为图像各个地方对该
5、上下文信息的响应,响应最大的地方自然就是满足这个上下文的地方,也就是目标了。三、相关理论描述3.1、 上下文的重要性时间和空间上的上下文信息对跟踪来说是非常重要的。虽然对跟踪,我们一直利用了时间上的上下文信息(用t去跟踪t+1等),但对空间上下文信息的利用却比较匮乏。为什么空间上下文信息会重要呢?考虑我们人,例如我们需要在人群中识别某个人脸(众里寻他千百度),那我们为什么只关注它的脸呢?如果这个人穿的衣服啊帽子和其他人不一样,那么这时候的识别和跟踪就会更加容易和鲁棒。或者场景中这个人和其他的东西有一定的关系,例如他靠在一棵树上,那么他和树就存在了一定的关系,而树在场景中是不会动的(除非你摇动摄
6、像头了),那我们借助树来辅助找到这个人是不是比单单去找这个人要容易,特别是人被部分遮挡住的时候。还有一些就是如果这个人带着女朋友(有其他物体陪着一起运动),那么可以将他们看成一个集合结构,作为一组进行跟踪,这样会比跟踪他们其中一个要容易。总之,一个目标很少与整个场景隔离或者没有任何联系,因为总存在一些和目标运动存在短时或者长时相关的目标。这种空间上下文的相关性就是我们可以利用的。在视觉跟踪,局部上下文包括一个目标和它的附近的一定区域的背景。因为,在连续帧间目标周围的局部场景其实存在着很强的时空关系。例如,上图中的目标存在着严重的阻挡,导致目标的外观发生了很大的变化。然而,因为只有小部分的上下文
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 时空 上下文 视觉 跟踪 STC 算法 解读 代码 复现