小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

ViT(视觉变换器)通过将图像分割为小块并利用自注意力机制,成为计算机视觉领域的重要模型。尽管缺乏先验知识,但在大数据集上表现优越。Swin Transformer在此基础上进一步改进,适应多尺度特征,提升检测和分割效果。

一文通透ViT:把图片划分成一个个patch块后再做注意力计算,打破CNN在CV领域的统治地位(含Swin Transformer的详解)

结构之法 算法之道
结构之法 算法之道 · 2025-08-22T14:37:43Z

本研究通过集成学习和多维视频Swin Transformer模型,解决了传统孤立手语识别中视角单一的问题,提升了模型在不同视角下的鲁棒性和泛化能力,并在相关比赛中获得第三名。

Sign Language Recognition from Multiple Views Using Ensemble Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

本研究提出了一种新方法,利用五种Mamba模型变体和Swin Transformer模型,自动识别X射线图像中的冠状动脉狭窄。U-Mamba BOT模型的F1分数达到68.79%,比半监督方法提高了11.8%。

Segmentation of Coronary Artery Stenosis in X-ray Angiography Based on Mamba Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

本研究提出ST-Tree模型,结合Swin Transformer与神经树,旨在提高多变量时间序列分类的准确性和可解释性,并可视化决策过程,推动时间序列分析的发展。

具有可解释性的多变量时间序列分类ST-Tree

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z
火山引擎夺得AIM2024大赛超分质量评估赛道冠军

火山引擎多媒体实验室在2024年ECCV的AIM Workshop视频超分辨率质量评估赛道中获胜。团队开发了基于大模型的画质评估算法,采用Rich Quality-Aware Feature架构和Swin Transformer-B,提升了模型的泛化能力,并解决了传统算法的失真问题。

火山引擎夺得AIM2024大赛超分质量评估赛道冠军

实时互动网
实时互动网 · 2024-10-12T03:26:44Z

本研究提出了FastTextSpotter框架,结合Swin Transformer和Transformer编码-解码架构,提高OCR中的场景文本识别准确率和处理速度。实验结果显示该框架在多语言场景文本的检测和识别方面表现出色。

FastTextSpotter:一种高效的多语言场景文本检测变换器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z

本文介绍了多种视觉 Transformer 模型及其在计算机视觉任务中的应用,包括 Swin Transformer、Shuffle Transformer 和 TVSD-Net。这些模型通过创新的注意机制和特征聚合方法,在图像分类、目标检测和阴影检测等领域表现出色,实验结果显示其性能优于现有技术。

SwinShadow: 模糊相邻阴影检测中的移位窗口

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

本文介绍了多种基于Swin Transformer的模型,如DarSwin、MS-Unet和DS-TransUNet,旨在提升图像畸变矫正和医学图像分割的效果。这些模型在不同的畸变水平和医学任务中表现出色,展示了深度学习在图像处理领域的潜力。

DarSwin-Unet: 扭曲感知编码器 - 解码器结构

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-24T00:00:00Z

本文介绍了多种基于Transformer的图像超分辨率模型,如Hybrid Attention Transformer、Swin Transformer和S2R。这些模型通过结合不同的注意力机制和预训练策略,显著提升了超分辨率性能,实验结果在多个基准测试中优于现有方法。

HiT-SR:高效图像超分辨率的层次 Transformer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z
Swin Transformer:最佳论文,准确率和性能双佳的视觉Transformer | ICCV 2021 - 晓飞的算法工程笔记

论文介绍了Swin Transformer模型,旨在提升计算机视觉任务的准确率。该模型通过构建层级特征和采用线性计算复杂度,显著提高了图像分类、目标检测和语义分割的性能。实验结果表明,Swin Transformer在多个视觉任务中超越了传统卷积神经网络。

Swin Transformer:最佳论文,准确率和性能双佳的视觉Transformer | ICCV 2021 - 晓飞的算法工程笔记

晓飞的算法工程笔记
晓飞的算法工程笔记 · 2024-07-02T05:16:00Z

本文探讨了利用Swin-Transformer和像素聚焦损失函数处理RAW图像中的缺失像素问题,提出了DeepISP模型用于图像信号处理,并验证了其在视觉质量和客观评估中的优越性。此外,研究还介绍了基于事件相机的运动分割和重建算法,展示了其在复杂环境中的应用效果。

DemosaicFormer:适用于混合 EVS 相机的粗糙到精细的解马赛克网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-12T00:00:00Z

本文介绍了多种视频去模糊方法,包括Flow-Guided Sparse Transformer(FGST)和模糊插值变换器(BiT),它们在不同数据集上表现优异。研究强调了运动信息的重要性,并提出了基于极坐标的Radial Strip Transformer架构,显著提升了去模糊性能。此外,Swin Transformer为骨干的SUNet模型在低光条件下展现了卓越的适应性。

模糊感知时空稀疏变压器用于视频去模糊

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

该研究提出了一种基于Swin Transformer的多功能算法,能够同时进行人脸识别、面部表情识别、年龄和属性估计。通过动态多任务学习方法,算法可根据任务难度调整权重,提升性能。此外,研究探讨了轻量级卷积神经网络在多任务学习中的应用,展示了在多个数据集上的优越表现。

任务自适应的 Q-Face

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-15T00:00:00Z

本文探讨了一种基于Swin Transformer的图像去噪和恢复新方法,提出了DS-TransUNet网络架构,显著提升了医学图像分割质量。研究还展示了深度学习在图像恢复中的加速效果,强调无监督训练和良好的泛化能力。

基于 Swin Transformer UNet 的地面图像去模糊

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

本文介绍了基于Swin Transformer的医学图像处理模型,包括重建Swin Transformer (RST)和双重Swin Transformer U-Net (DS-TransUNet),显著提升了4D MRI重建和医学图像分割效果。此外,提出了多维统一Swin Transformer (MDU-ST)用于3D病灶分割,展现出优越性能,适用于自动化肿瘤生长建模研究。

密集残差 Swin Transformer 用于连续无深度限制超声成像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-25T00:00:00Z

本研究设计了一个强健的盲图像质量评估方法,通过训练多个基于Swin-Transformer的模型,并使用伪标签构建大规模真实世界图像数据集,最终的跨数据集强健模型性能优于最新方法。

高分辨率图像质量数据库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-29T00:00:00Z

本文介绍了一种名为MS-UNet的新型U-Net模型,用于医学图像分割任务。该模型采用基于Swin Transformer的多尺度嵌套解码器,并引入了边界损失和去噪模块,提高了分割性能。实验证明,MS-UNet在特征学习和少量训练数据方面表现出色。

U-Net v2:重新思考 U-Net 的跳跃连接在医学图像分割中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-29T00:00:00Z

本研究提出了一种新的多维统一的 Swin Transformer 模型,用于 3D 病灶分割。该模型利用自我监督的先验任务学习病灶解剖学的潜在模式,并在同一编码器中学习相应的语义信息。该方法在内部数据集上表现出显著改进,可用于自动化的 3D 病灶分割。

RT-SRTS:单次 X 射线投影中的角度无关实时三维重建和肿瘤分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-12T00:00:00Z

本研究提出了一个强健的盲图像质量评估方法,通过训练多个基于 Swin-Transformer 的模型并生成伪标签构建了大规模真实世界图像数据集,训练了跨数据集强健模型,交叉数据集测试结果表明该方法性能优于最新方法。

跨数据集鲁棒的盲目现实世界图像质量评估方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-26T00:00:00Z

本文介绍了一种名为MS-UNet的新型U-Net模型,用于医学图像分割任务。MS-UNet采用了基于Swin Transformer的多尺度嵌套解码器,并引入了边界损失和去噪模块。实验证明,MS-UNet在特征学习和分割性能方面表现出色,尤其在少量训练数据的情况下。

MS-UNet-v2: 医学图像分割的自适应降噪方法与小数据训练策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码