Mamba刚火就凉了？视觉真的需要Mamba吗？_manbaout,do we really need mamba for vision

作者：代码探险家 | 2024-07-26 13:45:04

踩

manbaout,do we really need mamba for vision

点击下方卡片，关注「3D视觉工坊」公众号
选择星标，干货第一时间送达

来源：3D视觉工坊

添加小助理：dddvision，备注：方向+学校/公司+昵称，拉你入群。文末附行业细分群

扫描下方二维码，加入3D视觉知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门视频课程（星球成员免费学习）、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！

0. 这篇文章干了啥？

近年来，Transformer已成为各种任务的主流骨干，支撑着诸多重要模型，如BERT、GPT系列和ViT。然而，Transformer的token mixer，也就是attention，随着序列长度的增加，产生了二次复杂度，给处理长序列带来了重大挑战。为了解决这个问题，已经引入了一系列与 token 长度线性复杂度相关的 token mixer，例如 d

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/代码探险家/article/detail/885610