小红花·文摘

本研究分析了不同深度学习分类器在物联网生态系统中对高维数据的降维效果。结果表明，变分自动编码器（VAE）在准确率等指标上优于视觉转换器（ViT），为物联网安全提供了更有效的僵尸网络检测方法。

潜在空间维度对物联网僵尸网络检测性能的影响：VAE编码器与ViT编码器的比较

BriefGPT - AI 论文速递 ·

本研究提出了一种名为MaxGlaViT的轻量级视觉转换器模型，用于青光眼的早期诊断。该模型通过优化网络架构和引入注意机制，实现了92.03%的识别准确率，显示出在青光眼早期检测中的巨大潜力。

MaxGlaViT: A Novel Lightweight Vision Transformer-Based Approach for Early Diagnosis of Glaucoma Stages from Fundus Images

BriefGPT - AI 论文速递 ·

Evo-ViT是一种自我驱动的视觉转换器加速方法，通过选择和更新令牌来提升图像分类性能。研究提出了自适应计算、稀疏训练框架和高效压缩方案等多种优化技术，显著降低计算成本并提高模型准确性，支持边缘计算设备的应用。

令牌补偿器：在不重新调优的情况下改变视觉变压器的推理成本

BriefGPT - AI 论文速递 ·

本文介绍了多种基于自监督学习的医学图像处理模型，如Masked Autoencoders和视觉转换器，旨在提升医学图像分类、分割和异常检测的性能。研究表明，这些模型在多个医学图像任务中表现优于现有技术，显著提高了诊断质量和计算效率。

AMAES: 公共脑 MRI 数据上的增强掩码自编码器预训练用于 3D 本地分割

BriefGPT - AI 论文速递 ·

本文提出了一种无监督域自适应（UDA）方法，旨在将深度神经网络从合成数据源适应到真实数据源。通过引入对抗模块和自训练策略，实验结果表明该方法在城市场景的语义分割中表现有效且稳健。此外，研究探讨了视觉转换器在对抗性领域自适应中的应用，提出的模型在多个数据集上显著提升了性能。

EUDA：一种高效的自监督视觉 Transformer 无监督领域适应方法

BriefGPT - AI 论文速递 ·

本文介绍了多种基于Transformer的视觉转换器模型，如HSViT、CST、HST、HRViT和IPT-V2。这些模型通过创新架构和特征嵌入，提升了图像分类、重建和分割的性能，显著提高了准确率和计算效率。

层次可分离视频变压器应用于快照压缩成像

BriefGPT - AI 论文速递 ·

本文提出了一种基于视觉转换器自我蒸馏的领域泛化方法，用于糖尿病视网膜病变分类。通过多源和单源实验，验证了该方法在分类中的有效性和优越的校准性能，强调了简单方法在医学图像泛化任务中的重要性。

糖尿病性视网膜病变中解缠表示的普遍化

BriefGPT - AI 论文速递 ·

本文介绍了一种结合物理雾先验和聚合时间信息的视频除雾框架，并构建了大规模室外视频除雾数据集。实验结果表明，该方法表现优越。此外，文中还提出了多种去雾算法，包括基于编码器-解码器网络、残差学习和视觉转换器的技术，均在去雾效果上取得显著进展。

利用非对齐正则化进行驾驶视频去雾以提供安全辅助

BriefGPT - AI 论文速递 ·

本研究开发了一种高效的淋巴瘤分割方法，结合18F-氟脱氧葡萄糖正电子发射断层扫描与计算机断层扫描，利用视觉转换器和双编码器，显著提升了图像分割的效率和准确性，同时提出了局部掩码重建机制和基于原型的Transformer架构。

基于多尺度局部视场特征重建的高效预训练模型应用于 PCB CT 图像元素分割

BriefGPT - AI 论文速递 ·

本文提出多种基于提示学习的方法，以提高视觉转换器（ViT）在领域泛化中的性能。通过无标签领域通用化框架和层次对比式视觉提示等技术，实验结果表明这些方法在医学图像分类和视觉语言导航任务中优于现有技术，显著提升了模型的泛化能力和准确性。

跨域泛化的过渡式视觉 - 语言提示学习

BriefGPT - AI 论文速递 ·

本文介绍了多种视觉转换器和预训练策略在三维检测和医学图像分析中的应用，包括GeoMIM、M$^{3}$3D和MIM。研究表明，遮蔽图像建模技术能提高学习效率和精度，MIM方法在不同任务中表现优异。此外，提出的多模态训练方案4M和Mask3D方法也展示了在视觉基础模型和场景理解任务中的潜力。

MIM4D：多视角视频遮蔽建模的自动驾驶表示学习

BriefGPT - AI 论文速递 ·

本研究提出了上下文自编码器（CAE）用于模糊图像建模，增强表示学习和下游任务表现。通过自监督学习和视觉转换器架构，模型在数据稀缺的情况下实现了显著的性能提升。掩码自动编码器（MAE）等方法提高了计算效率和准确率，展示了在视觉模式识别中的应用潜力。

掩蔽胶囊自编码器

BriefGPT - AI 论文速递 ·

本文介绍了一种基于视觉转换器（ViTs）的视觉推理模型，通过优化物体实体及其关系概念，提升了ViTs的推理能力。同时，引入了概念特征字典，促进全局关系推理和语义对象特定一一对应关系学习。实验证明，该模型在HICO和GQA上的性能优于之前的方法，并考虑了ViT变体和超参数的稳健性。

EL-VIT: 使用交互可视化研究视觉 Transformer

BriefGPT - AI 论文速递 ·

本文重新审视了注意力机制与大内核卷积神经网络在视觉转换器中的关系，并提出了一种新的空间注意力机制，称为大内核卷积注意力（LKCA）。LKCA通过将注意力操作替换为单个大内核卷积来简化注意力机制。实验证实，LKCA在视觉任务中表现出竞争性能。

LKCA：大卷积核关注

BriefGPT - AI 论文速递 ·

本文综述了基于视觉转换器的人工智能方法在肺癌成像应用方面的最新发展，提供了关键洞察和推动该领域发展的数据集。视觉转换器模型在肺癌应用中越来越受欢迎，但计算复杂性和临床相关性是未来研究的重要因素。该综述为研究人员提供了宝贵的见解，以推进肺癌诊断和预后的最新技术。

从数据到洞见：甲状腺癌研究中的先进应用综述

BriefGPT - AI 论文速递 ·

该研究调查了视觉转换器中的社会偏见，发现反事实增强训练可以缓解偏见，大模型的偏见较少，辨别目标训练的模型偏见较少。不同自监督目标训练可能导致相反的偏见。研究揭示了导致社会偏见的因素，并提出了公平改善的模型设计选择。

量化文本到图像生成模型中的偏差

BriefGPT - AI 论文速递 ·

该研究探讨了视觉转换器中社会偏见的因素，发现反事实增强训练可以缓解偏见，大模型偏见较少，使用辨别目标进行训练的模型偏见也较少。学习到的社会偏见存在不一致性，ViTs可能表现出相反的偏见。研究提出了基于模型设计选择可以实现相当大程度的公平改善。

探索基于预训练视觉转换器的自然图像和生成图像检测系统的公平性，并理解图像压缩对公平性的影响

BriefGPT - AI 论文速递 ·

本文综述了基于视觉转换器的人工智能方法在肺癌成像应用方面的最新发展，提供了性能提升的关键洞察。视觉转换器与卷积神经网络或UNet模型相结合，用于发展肺癌应用的人工智能方法。计算复杂性和临床相关性是未来研究的重要因素。该综述为医疗保健领域的研究人员提供了宝贵的见解，推进肺癌诊断和预后的最新技术。

利用视觉转换器改善肺癌的诊断和预后：一项范围性综述

BriefGPT - AI 论文速递 ·