搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
黑客灵魂
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
Django基础之MTV模型
2
AOE与AOV的区别_aoe网和aov网的区别
3
数据结构小结_数据结构中lowcast是什么意思
4
Eureka原理实践
5
阿里云服务器 篇七:服务器热备份/定时备份
6
转行做程序员,你一定要考虑清楚这4件事
7
数据抽取+dataworks的使用+ADB的应用
8
深入理解Java虚拟机之【堆】_jvm的java堆的概念
9
AI智能人机对话小程序系统源码 附带完整的搭建教程_小程序接入智能体
10
计算机行业研究及2020年策略:聚焦主赛道,投资真成长(84页)
当前位置:
article
> 正文
Online Tracking by Learning Discriminative Saliency Map with Convolutional Neural Network_saliency map结合1d-cnn
作者:黑客灵魂 | 2024-08-21 06:30:03
赞
踩
saliency map结合1d-cnn
《Online Tracking by Learning Discriminative Saliency Map with Convolutional Neural Network》
本文提出了一个通过用CNN学习可区分性的显著图的在线视觉跟踪算法。给定一个在大规模图片数据集上在线下预训练的CNN,本文的算法将网络的隐含层的输出当做是特征描述子,因为他们在各种各样的视觉识别问题上表现出非常好的表达能力。这些特征通过使用一个在线SVM被用来学习一个可区分性的目标外观模型。此外,作者构想了一个特定目标的显著图,通过在SVM的指导下反向传播CNN特征,最后得到每一帧的最终的跟踪结果,它是基于外观模型和显著图谱生成和构造的。因为显著图谱能够有效地可视化目标的空间结构,所以他提高了目标定位的精度,并且使我们能够实现像素级的目标的语义分割。
本文作者提出一种新的跟踪算法,它是基于一个预训练的CNN来表达目标,这个CNN网络他最初是为了大规模图像分类任务而训练的。在CNN的隐含层的顶端,作者添加了一个额外层,这一层是一个在线的SVM,它是用来学习目标对象的外观,以便很好的将它从背景中区分开来。这个通过SVM学习的模型被用来计算一个特定目标的显著图谱,是
通过反向传播和目标对象相关的信息到输入层来完成的。
然后利用特定目标的显著图谱来得到生成目标外观的模型(滤波器),通过理解目标对象的空间结构来进行跟踪。
本文的几点贡献:
1、尽管目前基于CNN的跟踪算法都试图用一个在线的方式来学习网络,但是我们的算法采用了一个预训练的CNN来表达目标对象的一般特征,并且取得了非常出色的效果。
2、作者提出了一种构造特定目标显著图的技术,在训练CNN的反向传播误差的时候,它是通过反向传播只和目标对象相关的特征,这种做法克服了现有方法的一些缺陷(限制),只是可视化和预定义类别相一致的显著图。这个技术也是我们能够获得像素级的目标分割。
3、我们在线学习了一个简单的特定目标外观的滤波器,并且将它运用到显著图中,这个策略提高了目标的定位性能,这跟CNN特征的平移不变性的性能是一样的。
Overview of Our Algorithm:
本文的跟踪算法采用了一个预训练的CNN来表示目标。对于每一帧视频,首先我们要采取一些候选样本,这些候选区域是在上一帧视频中目标对象的周围采样的,得到这些图像的观察值后,我们用预训练的CNN来提取这些采样图像的特征描述。我们发现,这些从CNN提取到的语义信息特征是非常有效的,它能够成功的处理结构和光照变化。然而这些特征表示由于CNN的pooling操作会丢失掉目标的一些空间信息,这对于目标跟踪是不太令人满意的,因为空间信息对于目标的精确定位是非常有效的。
为了充分利用CNN特征的表示能力来保存目标的空间信息,我们采用指定目标对象的显著图作为我们的观察值来做跟踪,这些显著图是通过反向传播指定目标对象的CNN特征信息到输入层而产生的。类别特定的显著图是通过反向传播相应的信息到特定的标签来可视化感兴趣的区域来建造的。因为视觉跟踪问题属于一个任意类别的问题,他的类别是不知道的,目标类别的模型是很难预训练到的。
因此,我们采用一个在线的SVM,它能够利用从CNN模型学习到的特定目标的特征来从背景中区分出目标对象,通过在线SVM学习到的特定目标的信息被看做是类别信息。SVM能够区分每一个样本,我们计算每一个正样本显著图,通过沿着预训练的CNN模型反向传播他的CNN特征到输入层,整个过程是在SVM的指导下进行的。每一个显著图会会将从背景中区分得到的目标区域高亮。这个特定目标显著图减轻了CNN特征做视觉跟踪的限制,通过提供目标对象的重要的空间结构特征。
接下来,跟踪算法可以表述为一个顺序的贝叶斯滤波框架,在跟踪的时候用特定目标显著图作为观测值。然后一个产生式的外观模型通过随着时间的推移累加目标的观测值(特定目标的显著图)来构造,它能够揭示目标的有意义的空间构造(例如形状和局部)。然后每一帧的一个密集的似然图谱可以有效的通过卷积来计算,这个卷积操作是发生在特定目标的显著图和产生式外观模型之间的。
本文的算法利用了在线SVM的可区分性的性能,他帮助我们生成一个特定目标显著图谱。此外,作者利用显著图谱来构建产生式外观模型,通过顺序贝叶斯滤波来执行跟踪。这样就很自然的结合了判别式和产生式方法。
3.1 预训练CNN来提取特征描述子
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/黑客灵魂/article/detail/1010571
推荐阅读
article
「读论文」A-
GCL
:
Adversarial
graph
contrastive
learning
...
神经发育障碍的准确诊断是一项具有挑战性的任务,因为耗时的认知测试和潜在的人类偏见。为了解决这一挑战,我们提出了一种新的基...
赞
踩
article
吴恩达深度
学习
笔记及作业答案|Coursera
Deep
learning
Notes
- Impr...
Deep
learning
, dropout (inverted dropout), Early stopping, n...
赞
踩
article
论文阅读
DIFFUSION
POLICIES
AS AN
EXPRESSIVE
POLICY
CLA...
Diffusion-QL有两个主要组成部分:使用扩散模型作为策略:通过将策略建立在条件扩散模型的逆向链上,扩散模型允许构...
赞
踩
article
Diffusion
Policy
:
Visuomotor
Policy
Learning
via
A...
本篇主要根据论文中内容和引申内容,做出了对于主要技术路线的讲解,接下来可能还会继续更新关于代码和实验复现的相关内容,欢迎...
赞
踩
article
【全网独家】
吴恩达
的
新书 《
Machine
Learning
Yearning
》中文
编译
版-----...
3、
先决条件
和符号如果你学过机器学习课程,比如Coursera上
的
机器学习MOOC,或者你有使用过监督学习
的
经验,你就能...
赞
踩
article
Oracle
20c
新特性:Online
SecureFiles
Defragmentation ...
墨墨导读:在使用
LOB
的时候,可能大家都遇到过
碎片
和空间问题的困扰,在
20c
中,
Oracle
提供了对于 Secu...
赞
踩
article
验证Cen
to
s7.5 基于MySQL5.7 的
InnoDB
Cluster
高可用环境部署_cl...
前言采用
InnoDB
Cluster
, 每台服务器实例,都运行MySQL Group Replication (即冗余复...
赞
踩
article
基于
Deep
Learning
的
视频
识别方法
概览...
深度学习在最近十来年特别火,几乎是带动AI浪潮的最大贡献者。互联网
视频
在最近几年也特别火,短
视频
、
视频
直播等各种新型UG...
赞
踩
article
ICIP 2009 Papers_2009-
robust
lane
detection
and tr...
以下转载ICIP 2009录用文章的题目,希望从其中能够发现有用的信息。想来当初也是打算投一个的,可是怎么看总觉得创新不...
赞
踩
article
Self
-
Supervised
Learning
for
Point
Clouds
Data
: A ...
Self
-
Supervised
Learning
for
Point
Clouds
Data
: A Survey的阅读笔...
赞
踩
article
[
paper
阅读笔记][2024]
Learning
with
Noisy
Foundation
Mo...
本文任务虽然是:在下游任务中有效地利用含噪声的预训练基础模型,但其实其本质科学问题是:如何在存在数据噪声的情况下保持和提...
赞
踩
article
深度强化学习笔记_
goal
oriented
reinforcement
learning
...
强化学习笔记_
goal
oriented
reinforcement
learning
goal
oriented
rei...
赞
踩
article
CVPR2024
Tracking
汇总_
diffusion
track:
point
set dif...
大模型辅助总结。_
diffusion
track:
point
set
diffusion
model
for
visua...
赞
踩
article
CVPR2021
跟踪
算法
TransT
代码详解(
Transformer
Tracking
)...
此外,我们将第四阶段的3×3卷积修改为步长为2的扩张卷积,以增加感受野。-“pred_boxes”:所有特征向量的归一化...
赞
踩
article
Backbone
is All
Your
Need A
Simplified
Architectur...
论文地址:https://arxiv.org/pdf/2203.05328。_simtracksimtrack ...
赞
踩
article
ICCV2023
Tracking
paper
汇总(二)(多
目标
跟随、单
目标
跟随等)_
24
年 多
目标
...
在视觉
目标
跟踪
(VOT)和视频
目标
分割(VOT,VOS)的共同目的。一些研究已经尝试过联合
跟踪
和分割,但在初始化和预测中...
赞
踩
article
【论文笔记】
Diffusion
Track:
Diffusion
Model
For
Multi
-Ob...
【论文笔记】
Diffusion
Track:
Diffusion
Model
For
Multi
-
Object
Track...
赞
踩
article
CVPR
2021 Trans
for
mer
Meets
Tracker
:
Exploiting
Te...
本文提出了一个trans
for
mer辅助的跟踪框架,利用连续帧的时间上下文信息来增强视觉跟踪。通过trans
for
mer...
赞
踩
article
<Trans
for
mer
Meets
Tracker
:
Exploiting
Temporal
Co...
该研究引入Trans
for
mer架构来利用视频中的时间上下文,改进视觉跟踪。通过Trans
for
mer编码器增强目标模板...
赞
踩
article
目标跟踪DiMP:
Learning
Discriminative
Model
Prediction
...
这篇博客详细介绍了DIMP跟踪算法,它是一个具有端到端学习和在线更新能力的架构,不同于Siamese网络仅关注外观信息。...
赞
踩
相关标签
学习
python
计算机视觉
pytorch
深度学习
人工智能
机器学习
论文阅读
笔记
MySQL5.7集群
InnoDBCluster部署
安装mysql shell
安装mysql-route
mysql集群日常维护
image
classification
video
algorithm
compression
h.264
论文笔记