小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

ViT(视觉变换器)通过将图像分割为小块并利用自注意力机制,成为计算机视觉领域的重要模型。尽管缺乏先验知识,但在大数据集上表现优越。Swin Transformer在此基础上进一步改进,适应多尺度特征,提升检测和分割效果。

一文通透ViT:把图片划分成一个个patch块后再做注意力计算,打破CNN在CV领域的统治地位(含Swin Transformer的详解)

结构之法 算法之道
结构之法 算法之道 · 2025-08-22T14:37:43Z

本研究提出CFIS-YOLO模型,旨在解决木材缺陷检测中的高成本和主观性问题。该模型通过增强结构和新损失函数,提高了多尺度特征融合和小物体定位能力,在公共数据集上达到了77.5%的mAP,验证了其在资源受限环境中的有效性。

CFIS-YOLO: A Lightweight Multi-Scale Fusion Network for Edge-Deployable Wood Defect Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

本研究提出Nes2Net架构,直接处理高维语音特征,显著提升多尺度特征提取能力,实验结果显示性能提升22%,计算成本降低87%。

Nes2Net: A Lightweight Nested Architecture for Model-Driven Voice Anti-Counterfeiting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-08T00:00:00Z

本研究提出了一种基于注意力的多尺度时间融合网络,用于多模式过程中的故障诊断。该方法通过提取多尺度特征和时间注意力机制,提高了诊断准确性,实验结果表明其性能优越且模型体积小。

Attention-Based Multi-Scale Temporal Fusion Network for Uncertain Fault Diagnosis in Multimode Processes

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z

本研究针对视觉复杂性建模中的可解释性问题,提出了多尺度特征以克服传统模型的局限,并引入新的SVG数据集,强调数据特性在理解视觉复杂性中的重要性。

数据中心化方法:视觉复杂性的维度及其探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z

本研究提出了一种新型肺结节分割模型S3TU-Net,结合多维空间连接和超像素视觉变换器,利用结构化卷积块和多尺度特征融合技术,显著提升了分割性能。实验结果显示,S3TU-Net在LIDC-IDRI数据集上表现优于现有方法。

S3TU-Net: Structured Convolution and Superpixel Transformer for Lung Nodule Segmentation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z

本研究提出了VMGNet模型,旨在解决深度学习机器人抓取技术的高计算复杂度问题。该模型通过引入视觉状态空间,实现线性计算复杂度,并通过多尺度特征融合提升准确性。实验结果表明,抓取成功率达到94.4%。

VMGNet:基于VMamba的低计算复杂度机器人抓取网络,采用多尺度特征融合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z

本研究提出了一种尺度感知图注意力视觉变换器(SAG-ViT),旨在提高视觉变换器在多尺度特征表示中的效率。该模型通过优化节点嵌入,在图像分类任务中显著提升了性能。

Scale-Aware High-Fidelity Image Patching Method Combined with Graph Attention for Vision Transformers

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本文提出了新框架MSTA3D,旨在解决3D实例分割中的过度分割问题,尤其是大物体的分割。MSTA3D结合多尺度特征、双注意力机制、箱体查询和正则化,实验结果在多个数据集上优于现有方法。

MSTA3D:多尺度双注意力用于 3D 实例分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

Transformer在图像超分辨率任务中表现优异,但传统方法计算复杂度高。论文提出HiT-SR策略,通过分层窗口和空间-通道相关方法,提高多尺度特征聚合效率。HiT-SR利用扩展窗口和线性复杂度方法,改善长距离依赖。实验显示,HiT-SR在性能、参数和速度上优于现有方法,速度提升约7倍。

HiT-SR:基于层级Transformer的超分辨率,计算高效且能提取长距离关系 | ECCV'24 - 晓飞的算法工程笔记

晓飞的算法工程笔记
晓飞的算法工程笔记 · 2024-10-15T06:02:00Z

本文介绍了多种医学图像分割方法,如SA2-Net、MFA-Net、MCANet和MS-Twins,利用多尺度特征学习和注意力机制提高分割精度。这些新模型在处理复杂医学图像时表现优于传统方法,能够更好地捕捉上下文信息和细粒度特征。

MSA2Net:多尺度自适应注意引导医学图像分割网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-31T00:00:00Z

本研究提出了一种新型图像匹配方法Dual-Branch Transformer,利用不同尺寸的图像块学习多尺度特征,从而提升图像匹配性能。该方法在ImageNet1K数据集上表现优异,具备强大的特征提取能力和较低的计算复杂度。

CTRL-F:通过多级特征交互和表示学习融合,在图像分类中将卷积与 Transformer 结合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

本文提出了一种新型的像素级全景分割方法,适用于卫星图像时间序列,利用时序注意力机制提取多尺度特征。同时,开发了公开的卫星图像数据集PASTIS,并展示了该方法在语义分割任务中的优越表现。

卫星影像时序的多模态视觉转换器用于作物分类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

本文介绍了一种基于深度学习的单图像去反射新方法,该方法利用位置感知和多尺度特征,显著提高了反射去除效果。研究表明,该方法在多个数据集上优于现有技术,具有良好的应用前景。

朝着人工引导的灵活互动去除反射

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-03T00:00:00Z

本文探讨了视觉地点识别(VPR)的新定义及其挑战,介绍了基于Transformer的模型TransVPR,提升了多尺度特征聚合和全局视觉特征的性能。研究提出了通用VPR解决方案,显著提高了识别精度,并分析了图像分辨率对VPR的影响,旨在推动VPR在商业应用中的发展。

基于注册辅助的视觉地点识别聚合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-19T00:00:00Z

本文提出了一种基于图卷积神经网络的三维人体姿态估计方法,结合多尺度特征和迭代图滤波,优化了计算效率和精度。实验结果表明,该方法在多个基准数据集上超越了现有技术,具有实际应用价值。

多跳图变换网络用于 3D 人体姿势估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-05T00:00:00Z

研究表明,深度显著性模型在视觉对象识别中优于传统模型,尤其在自然图像上。通过卷积神经网络提取多尺度特征并结合上下文信息,能有效提高视觉显著性预测的准确性。该方法适用于资源受限的应用,并在多个基准测试中表现良好。

抑制显著性,凸显语义:神经网络和大脑中的视觉转换

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

FocalClick 提出了一种交互式分割模型,能够通过快速推理实现目标区域的粗细分割,显著降低 FLOP,并优化点击率预测的无模型预训练框架。研究还介绍了多尺度特征传播网络和基于变分推断的概率融合网络,提升了语义分割的性能和鲁棒性。

MFP:充分利用概率图进行交互式图像分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

本文研究了卷积神经网络中的多尺度特征表示,提出了新型网络架构SFANet和MAFFSRN,以提高图像分割和超分辨率性能。实验结果表明,这些方法在多个数据集上表现优异,且参数需求和计算成本较低。

一种基于多尺度特征融合的轻量级注意力深度网络用于多视角面部表情识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-21T00:00:00Z

本文提出了一种新型无监督测试时训练(TTT)技术,通过最大化多尺度特征图与离散潜在表示之间的相互信息,整合到标准训练中。实验结果表明,该方法在不同测试时适应基准上表现出竞争力的分类性能。

TTT-KD: 基于基础模型的知识蒸馏进行测试时训练用于 3D 语义分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码