赞
踩
论文地址:https://arxiv.org/pdf/2010.13501.pdf
源码地址:https://github.com/XuelianCheng/LEAStereo
神经网络结构搜索(NAS)方法已经在多个邻域得到了应用,其基础思想为让模型在搜索空间中(如不同卷积核大小)根据设定的搜索策略来得到最适合该任务的架构。当前的立体匹配任务都基于人工设计的复杂模型结构,NAS方法还未广泛应用到该领域中。本文提出一种端到端训练的分层 NAS 框架,将人类的模型设计知识融入神经结构搜索框架中得到针对立体匹配任务的模型架构,该模型遵循常用的立体匹配的框架(特征提取、代价体构建、稠密匹配)。使用 NAS 算法来搜索特征模型与匹配模型,能同时从不同的模型架构、不同的特征图大小、与输出的视差图范围组成的搜索空间中得到得到最优的模型结构。
在深度学习领域,分割与立体匹配任务常用 Encoder-Decoder 结构,但基于U-Net结构的方法训练难度较大,而基于体素构建的立体匹配方法使用了较好的归纳偏置(人类设计模型结构知识),因此具有更快的收敛速度和更好的性能,该方法逐像素构建了3D代价体,然后基于3D代价体得到视差图,为此也带来了较大的计算量,这使得在NAS算法中搜索
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。