搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
喵喵爱编程
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
java调用微信公众号发送用户消息接口_小程序订阅消息推送(含源码)java实现小程序推送,springboot实现微信消息推送...
2
【Linux】进程间通信(3):共享内存
3
容器安全-----容器安全思维导图
4
【Web UI自动化】Python+Selenium 环境配置_python webui 自动化 selenium
5
php rand() 重复,php – mt_rand()给我总是相同的数字
6
30行代码,500万长文本推理提速8倍!「树注意力」让GPU越多省的越多
7
Mac安装Mysql-python遇到的坑,被这俩报错反复摩擦:'my_config.h' file not found 和 IndexError: string index out of range...
8
小程序配置自定义tabBar及异形tabBar配置操作
9
深圳程序员面试经验_深圳小公司程序员面试攻略
10
目标检测常用指标_置信度阈值
当前位置:
article
> 正文
近几年目标跟踪论文简单分类综述_目标追踪综述性论文
作者:喵喵爱编程 | 2024-07-31 20:24:37
赞
踩
目标追踪综述性论文
Siamese类
SiamFC(ECCV2016)
SiamRPN(CVPR2018 Spotlight):SiamFC+RPN
DaSiamRPN(ECCV2018)
SiamRPN++(CVPR2019):ResNet+multilevel feature,对每个层的特征都做RPN,再结合,和C-RPN不一样;
CFNet(CVPR2017):第一篇将Siamese和相关滤波结合
RASNet(CVPR2018 王强):对Siamese的网络详细分析,并且使用了三个attention来做
Triplet_tracker(ECCV2018):使用三元组的损失,没有改变输入,只是损失函数上做
MemTracker(ECCV2018):用了一个空间的attention,使得search区域更加准确,使用LSTM来控制模型更新,但是这个LSTM好像不怎么管用
SA_Siam(CVPR2018):网络有四个branch,将语义和表观特征结合使用,使用了一个channel attention
MBMD(VOT2018long-term 1):将Siamese网络作为预测网络,MDNet作为验证网络,然后Siamese使用的是MobileNet的网络结构,MDNet就是原始没有再训练,可以试试只用MobileNet做的效果;
EAST(ICCV2017):这篇文章提出使用不同的特征处理不同的图片,简单图片使用浅的手工特征,难的图片就使用深度特征,用线下训练的强化学习方式做决策;
FlowTrack(CVPR2018):利用FlowNet编码光流的信息,然后提出了Spatial-Temporal注意力机制来将光流信息集成到当前帧中;
SiamMask(CVPR2019):将视频语义分割应用到目标跟踪中来,就是在Siamese网络后面多加了一个segmentation回归分支,然后利用翻卷积来做segmentation的准确定位。因为多任务所以学到的特征泛化性更强;
C-RPN(CVPR2019):参考了two-stage的物体检测方式,在网络后面使用了三个RPN,后面两个RPN的输入都是上一个RPN的输出,这样网络就可以不用指定的anchor大小,而是自适应的,每个RPN还用了不同层的特征,最后再融合这些层的特征;
SiamDW(CVPR2019):加了很多Inception来做,就是把网络搞宽了,看不懂网络结构,复现大概也很难,调参会调死;
SINT++(CVPR2018): 提出了传统的正样本都是从groundtruth附近提取的,所以都很像,所以他先是弄了个正样本生成网络,然后加了一个根据强化学习的正样本生成网络,用SINT的结构,总体论文是看不懂了,不过不是E2E的,但是只需要很少的训练,不过看不懂确实很伤了;
DenseSiam(VOT获奖):使用非常密集的表示,把各个层的特征都放到一起,但是单看论文好像效果不是很好,但是人家在VOT2018 上好像表现很好,有空可以把代码跑一下;
SiamVGG(VOT2018):就是把backbone改成了用VGG16,然后在大数据集上训练,效果很好
TADT(CVPR2019):DAT和HART的结合,不过空间和尺度的attention弄到了channel维度上,用了两个loss来指导attention的学习,效果可以,论文写的很漂亮;
SPM-Tracker(CVPR2019):用了两个stage,一个用RPN回归出score,另一个通过前一个stage的输出来做proposal的选择,大概是这个意思,做的时候用了多层的特征,时间120FPS,效果很好;
ATOM(CVPR2019 oral):MD大神的作品,用了线下训练目标估计和线上训练分类来做,也提出了IoUNet的有用性,其实也可以理解为是一个two-stage的过程,也用了多层的特征;
EDCF(IJCAI2018):也是Siamese的框架只不过是弄了encoder和decoder的结构,有点像分割的那种形式来回溯到原来大小,然后根据响应去做的预测;
EDCF(IJCAI2018):王强的文章,用了编解码网络,通过反卷积回原始大小,来控制网络学到的特征鲁棒(类似hourglass的思路),同时比较巧妙使用多层特征,不是融合的方式,而且先相应做卷积,再相加(其实也是concate的一种方式),模型更新策略可以;
SPLT(ICCV2019) : 用了一个SiameseRPN来做初步的bbox的选择,然后弄了一个embedding网络来验证检测出来的proposal是否靠谱,若是不靠谱,就用还是用Siamese的结构来重新定位search region,再用SiameseRPN来跟踪。 是一个长程跟踪的算法,其中三大模块都是分开训练的,分三个模块是长程跟踪中比较经典的做法;
DiMP(ICCV2019):MD大神的新作,在Atom基础上更加优化的一篇文章,主要提出了一个新的类似合页损失的损失函数,来更加精确定位target,然后把网络的训练弄成端到端的了,没有像Atom一个backbone是固定的,跟Atom一样都是加了一个相关滤波层,使得Siamese类的网络对padding和stride的敏感度小。
MDNET类
MDNet(CVPR2016)
TCNN(ECCV2016):树型结构的MDNet,不过没有后续工作,浪费空间时间吧;
RT_MDNet(ECCV2018):使用了RoIAlign来加快网络特征提取,优化损失函数(instance的损失+classify的损失,类内与类间,有点triplet loss的感觉);
Meta-tracker(ECCV2018):指导模型在跟踪时的初始化过程,元学习应用,还用了一个
标签洗牌操作
,不知道管不管用;
DAT(NIPS2018):利用attention,不过只是将attention作为损失函数的一项,每帧更新模型一次,精度高速度慢;
VITAL(CVPR2018 Spotlight):把GAN引入,通过对抗学习一个Mask,意在提取一些general的特征,用多个Mask其实就是模拟target的变化,
还对样本进行reweighting
,平衡不同样本的影响,精度高速度慢;
LSART(CVPR2018 Spotlight):CNN的特征相关滤波相结合使用的,论文太难懂了;
HART(NIPS2017):利用了多种注意力机制,还对每种注意力机制都弄了损失函数,还使用了LSTM来做,但是最管用的还是多任务损失;
ANT(AAAI2019):用了多属性来跟踪,属性代表一些遮挡、尺度变化等,每个属性都有一个branch来编码;
UDT(CVPR2019):使用无监督的方式做,最巧妙的就是通过前向和反向做,来保证tracker的鲁棒性,还提出了三帧训练的形式,使得目标可以适应各种形式。
StarGAN+MDNet(ICASSP2019): 就是利用StarGAN去生成行人的不同姿态样本,作为艰难的正样本,去对正样本进行扩充,StarGAN和MDNet都是原来就有的框架,作者只是把它们一起用了而已,(其实有点像SiamPRN一样,但是效果很好,而且移植地好)
相关滤波
KCF(TPAMI2015):鼻祖
PTAV(ICCV2017):CF + deeplearning
CREST(ICCV2017Spotlight):将DCF搞成了网络中的一层,有点像SiamFC这种,但是不知道为什么精度比SiamFC高,然后用了残差学习来提精度;
MHIT:用了很多trick,融合多层特征,每层特征都过一个独立的CF分类器,最后弄了一个自适应的特征权重融合方式,而且提出了需要用到的多层特征最好不要相邻,相邻信息冗余了。使用了卡尔曼滤波做的运动信息编码;
TRACA(CVPR2018):引入了很多Auto-encoder来自适应编码输入图像,使得网络更加适应当前的样本,做了channel和空间上的数据增强,使得网络更加适应各种变换;
UPDT:用ECO的框架,但是研究了如何使用高层的深度特征和底层的手工特征,并且研究了如何用深的网络做跟踪;
VGG类?
DSLT(ECCV2018):提出了一个shrinking loss,有点类似focal loss,但是这篇文章的损失函数只惩罚简单样本,其他样本不改,但是精度比focal loss高,再者就是使用了反卷积做多层特征融合;
UPDT(ECCV2018):Martin大神的新作,分析了为什么跟踪中较深的网络不管用,并提出了不同的数据增强以及高低层特征融合的方式,值得借鉴把,是一篇比较有指导性的工作。
DEDT(CVPR2018):看不懂啊,只知道用了一个集成的跟踪器,用多个跟踪器来一起预测结果,训练的时候尽量使得每个分类器的耦合性低,就为了实现这个,他们自己生成耦合性低的样本,来分别训练,然后说是因为每帧都更新,所以结合了时间信息。不过实在太麻烦,还是ANT高明一些。
Attention 类
RASNet:residual+channel+general
DAT: 将attention作为一个损失函数的一个项
MemTracker:Spatial + Channel
SA_Siam : Channel
FlowTrack:Spatial + Channel
HART:Spatial + appearance
TADT:空间+尺度
DensSiam:用了self-attention,其实就是何凯明的non-local features的结构
Multilevel feature(感觉只有在层数比较多的网络才会用到)
SiamRPN++ : conv3+conv4+conv5
SA_Siam:conv4 + conv5
C-RPN:conv3+conv4+conv5
DSLT:用反卷积做,但是只用了两层
MHIT:用了很多层
EAST:用强化学习来决定用那层的特征
UPDT:深度特征+手工特征
SPM-Tracker:conv2 +conv4
ATOM
EDCF:conv2(CACF)+conv5
loss
VITAL : 就是使用了何凯明的focal loss;
RT_MDNet:也不算是focal loss,就是在损失函数上不仅计算了类内的距离,也考虑的类间的距离;
Triple_tracker:三元组损失;
DAT:正则化的空间attention损失;
HART:多种attention损失相加;
DSLT:Shrinking loss
DaSiamRPN:使得loss离distractor越远越好
EDCF:多任务损失
DiMP:类合页损失,使得正负样本之间距离大
多属性,多任务
SiamMask:用视频语义分割的方法和数据来训练
ANT:把遮挡、形变当成属性,多属性学习;
DEDT:用了集成的跟踪器,像Adaboost那样,集成多个分类器来做
多stage
C-RPN:三个stage
ANT:一个stage负责编码各种不同的属性,一个stage负责结合这些属性;
ATOM:一个stage得到bbox,一个stage用来分类;
SPM-tracker:一个stage得到粗糙的表示,另一个stage来区分distractor
EDCF:也是低层的结果作为后面层的输入,然后再调整的过程
时间序列
MEMTracker:LSTM控制;
FlowTracker:光流信息
无监督
UDT:无监督学习
GAN
VITAL:利用GAN来去生成mask,希望mask之后留下来的部分是最discriminate的。
StarGAN:就是用GAN去做数据增强,但是只对行人做了。
贴一张组会汇报时做的图
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/喵喵爱编程/article/detail/910567
推荐阅读
article
[
机器
学习
原理]
泊松
回归
...
需要
泊松
回归
的原因对因变量是离散型变量的问题建模时,普通的线性
回归
模型、定序
回归
模型和逻辑
回归
模型已经能解决我们大部分的...
赞
踩
article
C++
编码实践-2
需求
是
什么
_
代码
需求
是
什么
...
讨论
需求
分析的困难性及可能的解决措施。
_
代码
需求
是
什么
代码
需求
是
什么
本节开始讨论
需求
,...
赞
踩
article
2021
Robocom
决赛 第三题
_
2021
robocom
国赛决赛题解...
模拟,嵌套unordered
_
map统计、vector排序
_
2021
robocom
国赛决赛题解
2021
roboco...
赞
踩
article
sql
中
count
(
1
)
的
含义...
count
(
1
),其实就是计算一共有多少符合条件
的
行.
1
并不是表示第一个字段,而是表示一个固定值.其实就可以想成表中有...
赞
踩
article
113个
创新
创意
的
计算机
毕业设计
项目
,
应有尽有
,被朋友羡慕了_大三
计算机
创新
项目
课...
Springboot硕士研究生院校报考推荐系统
的
设计与实现26sfh。Springboot基于精准扶助信息管理平台
的
设计...
赞
踩
article
AI
大
语言
模型
的
模型
评估
与验证_
语言
模型
aouge
评估
...
1.背景介绍随着人工智能的发展,
大
型
语言
模型
(Large Language Models,简称LLMs)已经成为了自然语...
赞
踩
article
8.
DELL
R730
服务器
对
RAID5
进行扩容_
dell
raid5
增加
硬盘
扩容...
如果
服务器
的空间不足了,如何进行扩容?我基本上按照来进行操作。我的机器上已经有三块
硬盘
了,组了Raid5,现在再添加一块...
赞
踩
article
android14
预览版
介绍及
解读
_
mlock
android14
解读
...
android14
预览版
详细
解读
和介绍_
mlock
android14
解读
mlock
android14
解读
...
赞
踩
article
最全
计算机
毕业
设计
、大作业项目推荐(毕设
源码
+论文+
PPT
)_
计算机
本科
毕业
设计
源代码
下载
...
最全
计算机
毕业
设计
、大作业项目推荐(毕设
源码
+论文+
PPT
),模板
源码
,线上技术支持,辅助研发,承接研发项目。模板
源码
覆...
赞
踩
article
特征提取
——主
成分
分析
(
PCA
)_
pca
特征提取
...
特征提取
——主
成分
分析
(
PCA
) 2018/5/23引言:
特征提取
是机器学习中很常用数据处理方式,一般都出现在实际搭建模...
赞
踩
article
项目管理
【
gitee
】_
lnmp
+
gitee
项目管理
...
首次上传进入项目根目录,右键空白打开
【
git bash】初始化git,输入
【
git init】关联本地仓库和远端仓库,
【
...
赞
踩
article
mac OS
matplotlib
missing
from
font
(s)
DejaVu
Sans
...
原因是:
matplotlib
使用的字体列表中默认没有中文字体。我们可以在文件中手动指定
matplotlib
使用的字体。然...
赞
踩
article
【
Java
基础】 几种
简单
的
算法
排序
_
java
简单
的
排序
算法
...
Java
的
几种
简单
算法
排序
_
java
简单
的
排序
算法
java
简单
的
排序
算法
学习
Java
中...
赞
踩
article
什么
是
需求
分析
_
需求
分析
是
什么
?...
需求
分析
是指理解用户
需求
,就软件功能与客户达成一致,估计软件风险和评估项目代价,最终形成开发计划的一个复杂过程。(这个和...
赞
踩
article
用
PyTorch
从零开始
编写
DeepSeek
-
V2
...
本文详细介绍了
DeepSeek
-
V2
语言模型,这是一个强大的开源混合专家(MoE)语言模型,采用创新的架构来提高训练和推...
赞
踩
article
用
git
使
用
git
ee快速上手教学_
git
ee
使
用
git
...
其他地方教程太长,我搞一个简单实
用
,上手为主
git
教程文章目录 什么是
git
一、
git
二、
使
用
步骤 1.引入...
赞
踩
article
【人工智能】
反向
传播
算
法
及
梯度
下降
法
_
反向
传播
和
梯度
下降
算
法
...
本文详细介绍了
反向
传播
算
法
的工作原理,包括其通过计算误差调整权重的过程,以及在深度学习中的应用,特别是与
梯度
下降
法
(包括...
赞
踩
article
电压
基准和
稳压电源
-
BUCK
\
BOOST
原理讲解
_
buck
电路
知乎...
升压和降压
电路
,就是指电力电子设计当中常说的
BUCK
/
BOOST
电路
。这两种
电路
经常一起出现在
电路
设计当中,
BUCK
电路
...
赞
踩
article
Git 解
冲突
_
git
disabled
changes
...
1:怎样最大程度避免
冲突
?如果和别人改的不是同一个文件,最好先
git
pull 再
git
add如果要改同一个文件,...
赞
踩
article
poisson
分布及其
stata
实现_
stata
泊松
回归
...
泊松
回归
假设反应变量Y是
泊松
分布,并假设它期望值的对数可被未知参数的线性组合建模。
泊松
回归
模型有时(特别是当用作列联表模...
赞
踩
相关标签
机器学习
python
人工智能
大数据
泊松回归
c++
敏捷
算法
数据结构
PTA
sqlserver
课程设计
java
开发语言
计算
语言模型
AI
大模型
LLM
Java
Python
架构设计
Agent
RPA
服务器