小红花·文摘

本文探讨了改进 Transformer 模型的方法，包括门控注意力单元、线性近似和自我注意力机制，以提高内存利用效率和处理长序列的能力。研究表明，这些新模型在语言建模任务中显著提升了性能，同时降低了计算复杂度和内存需求。

TransformerFAM：反馈注意力即工作记忆

BriefGPT - AI 论文速递 ·

本文分析了自我注意力及其替代方案的归纳偏差问题，提出了等效的有限维凸问题。介绍了新型Transformer模型HiT，结合多维块自注意力与多层感知机，提升高清图像生成性能。提出MB-TaylorFormer，通过泰勒展开实现线性计算复杂度，改进去雾任务表现，并引入新注意力机制，优化Transformer性能，适用于多种视觉任务。

Mansformer：用于图像去模糊及其它任务的高效混合注意力转换器

BriefGPT - AI 论文速递 ·

本文提出了一种改进的 transformer 架构，通过自我注意力增强模型的稳定性和容错能力，解决了 softmax transformer 的秩坍缩问题。同时，研究探讨了基于强化学习的 PID 控制算法在四旋翼飞行器中的应用，证明其性能优于传统 PID 控制器。

基于 PID 控制的自主修复技术提升大型语言模型的鲁棒性

BriefGPT - AI 论文速递 ·

本文探讨了利用自我注意力的时间卷积网络和自监督视觉Transformer进行疾病预测的方法。通过将时间序列信号转化为时间嵌入，结合深度语义分割，实现了对不同类型用地的分类。研究表明，该方法在多模态学习中表现良好，有助于提升地理空间计算机视觉的用户体验和安全性。

短程和长程医学影像时间序列的时空表示学习

BriefGPT - AI 论文速递 ·