使用Vision Transformers实现高效语义分割的内容感知共享Token

news/2024/7/9 1:53:24

文章目录

  • Content-aware Token Sharing for Efficient Semantic Segmentation with Vision Transformers
    • 摘要
    • 本文方法
      • Content-aware token sharing framework
      • Content-aware token sharing policy
    • 实验结果

Content-aware Token Sharing for Efficient Semantic Segmentation with Vision Transformers

摘要

本文介绍了Content-aware Token Sharing(CTS),这是一种Token 减少方法,可以提高使用视觉转换器(ViTs)的语义分割网络的计算效率。现有的工作已经提出了Token 减少方法来提高基于ViT的图像分类网络的效率,但这些方法并不直接适用于我们在本工作中解决的语义分割。我们观察到,对于语义分割,如果多个图像块包含相同的语义类,则它们可以共享一个Token ,因为它们包含冗余信息。我们的方法通过使用一个高效的、与类无关的策略网络来利用这一点,该策略网络可以预测图像补丁是否包含相同的语义类,并允许它们共享Token 。
代码地址
在这里插入图片描述
Content-aware Token Sharing(CTS)。基于ViT的标准分割网络将固定大小的patch转换为token,并处理所有这些patch。为了提高效率,我们建议让语义相似的patch共享一个token,并在不降低分割质量的情况下实现相当大的效率提升。

本文方法

在这里插入图片描述
数据集统计信息:展示了有多少图像具有一定百分比的包含单个语义类的超匹配。我们假设这些超级伙伴可以共享一个token。

Content-aware token sharing framework

在这里插入图片描述
方法概述:

  1. 引入了一个策略网络p,该网络预测哪些图像patch可以在不降低性能的情况下共享令牌。
  2. 使用token共享模块ts将这些patch组合为单个令牌。随后,剩余的token通过 transformer模型馈送,并使用模块tu“共享”输出token
  3. 在进行每个token预测之后或在进行每像素预测之前

Content-aware token sharing policy

在这里插入图片描述
Token sharing policy:我们教导我们的Token sharing policy网络,如果超级patch包含单个语义类,那么它应该共享token
从左到右:(a)具有超级patch网格的输入图像;(b) 分割标签;(c) 包含单个类的超级patch;(d) 类别不可知的标签

实验结果

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


http://lihuaxi.xjx100.cn/news/1247043.html

相关文章

数据库架构是否该随着公司估值一起变化?

原文|The growing pains of database architecture 作者|Tim Liang, Software Engineer at Figma 2020 年,因为 Figma 不断加入新功能,筹备第二条产品线和用户不断增长导致数据库流量每年以 3x 速度增长,我们的基础设…

shell脚本变量-特殊变量

目录 特殊变量:$n案例需求 特殊变量:$#案例需求 特殊变量:$*、$案例需求 特殊变量:$?特殊变量:$$ 特殊变量:$n 语法 $n含义: 用于接收脚本文件执行时传入的参数 $0 用于获取当前脚…

2023年CPSM-3中级项目管理专业人员认证招生简章

CPSM-3中级项目管理专业人员认证,是中国标准化协会(全国项目管理标准化技术委员会秘书处)联合中国国际人才交流基金会,面向社会开展项目管理专业人员能力的等级证书。旨在构建多层次从业人员培养培训体系,建立健全人才…

Unity3D:场景视图视图选项

推荐:将 NSDT场景编辑器 加入你的3D工具链 3D工具集: NSDT简石数字孪生 “场景视图视图选项”工具栏 您可以使用“场景视图视图选项”工具栏“叠加”来选择用于查看场景以及启用/禁用照明和音频的各种选项。这些控件仅在开发期间影响场景视图&#xff0…

无人机上仅使用CPU实时运行Yolov5(OpenVINO实现)(下篇)

​上期中我们讲了Yolov5的前两节环境配置及简单运行,在本期中我们带来后面两节在不同处理器下的实验数据及如何训练自己的模型。​ 三、在不同处理器上的延迟与效果 为了查看Yolov5在不同设备上的延迟与效果,下面我们对Inter的i3、i5、i7三种处理器在同…

【aspose-words】Aspose.Words for Java模板语法详细剖析

文章目录 前言🍊缘由aspose-words模板语法再了解 🎯主要目标实现3大重点 🎁快速链接🍈猜你想问如何与狗哥联系进行探讨1.关注公众号【JavaDog程序狗】2.踩踩狗哥博客 🍯猜你喜欢文章推荐 正文🍋aspose-word…

2023-6-15-第六式适配器模式

🍿*★,*:.☆( ̄▽ ̄)/$:*.★* 🍿 💥💥💥欢迎来到🤞汤姆🤞的csdn博文💥💥💥 💟💟喜欢的朋友可以关注一下&#xf…

如何撰写高效且实用的Prompt

很多人说GPT并没有什么让人惊艳的地方,但实际上,他们并没有发挥好它的潜能。在很多情况下,他们往往没有使用恰当的prompt。一个恰到好处的prompt就如同魔法师在施展魔法时所需要吟唱的咒语,只有那些正确无误的咒语,才能…