小红花·文摘

本文介绍了在Apache TVM中为NVIDIA GPU编写高性能卷积操作的步骤，包括配置空间、设备测量、调优和错误处理，适合具备CUDA经验的开发者。

【TVM 教程】在 NVIDIA GPU 上调优高性能卷积

HyperAI超神经 ·

本研究发现传统Transformer在处理长序列时受限于键-查询乘积。通过将注意力机制转化为特征图并引入卷积操作，提出了一种新方法，大幅提升了Transformer的性能，展示了架构发展的潜力。

DAPE V2: Using Process Attention Scores as Feature Maps for Length Generalization

BriefGPT - AI 论文速递 ·

本论文介绍了一种名为Conformer的混合网络结构，利用卷积操作和self-attention机制进行增强表示学习。实验证明，Conformer在ImageNet上优于visual transformer（DeiT-B）2.3％，在MSCOCO上，在目标检测和实例分割方面都优于ResNet-101，具有成为通用主干网络的潜力。

LGFCTR: 图像匹配的局部和全局特征卷积变换器

BriefGPT - AI 论文速递 ·

本文介绍了一种名为Alterable Kernel Convolution（AKConv）的卷积操作，通过给卷积核赋予任意数量的参数和任意采样形状，提供了更丰富的权衡选择。AKConv通过不规则卷积操作改进了目标检测任务的网络性能。

AKConv：带有任意采样形状和任意参数数量的卷积核

BriefGPT - AI 论文速递 ·