繁依Fanyi0

这个屌丝很懒，什么也没留下！

热门标签

热门文章

当前位置: article > 正文

多模态综述_geolayoutlm

作者：繁依Fanyi0 | 2024-08-18 17:36:16

赞

踩

geolayoutlm

文章目录

Bert预训练
TextVQA
文档理解
文档大模型

Bert预训练

Bert 预训练
VilBERT，LXMERT，VisualBERT，Unicoder-VL，VL-BERT，ImageBERT

TextVQA

M4C | Paper | Code | 笔记
SA-M4C | Paper | 笔记
SMA | Paper | 笔记
MM-GNN | Paper
LoRRA | Paper | Code
QA R-CNN ｜ Paper
Simple is not Easy | Paper | Code | 笔记

文档理解

文档理解
LayoutLMFT、StructuralLM

文档大模型

UDOP
Unifying Vision, Text, and Layout for Universal Document Processing
收录：CVPR2023
论文：https://arxiv.org/abs/2212.02623
代码：https://github.com/microsoft/i-Code/tree/main/i-Code-Doc
解读：https://blog.csdn.net/m0_38007695/article/details/130218532?spm=1001.2014.3001.5501
FlexDM
Towards Flexible Multi-modal Document Models
收录：CVPR2023
论文：https://arxiv.org/abs/2303.18248
代码：https://cyberagentailab.github.io/flex-dm
GeoLayoutLM
GeoLayoutLM: Geometric Pre-training for Visual Information Extraction
收录：CVPR2023
论文：https://arxiv.org/abs/2304.10759
代码：https://github.com/AlibabaResearch/AdvancedLiterateMachinery

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/998428

推荐阅读

相关标签

Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。

闽ICP备14008679号