小红花·文摘 - 小红花技术领袖俱乐部

本文提出了一种新颖的端到端框架，结合ResNet和视觉变换器，利用可变形卷积等先进技术，显著提升自然图像的文本识别性能。实验结果表明，该框架在多个数据集上表现优异。

End-to-End Text Recognition and Retrieval-Augmented Generation Based on Deformable Optimized Transformer Architecture

BriefGPT - AI 论文速递 ·

本文探讨了自动驾驶中语义场景补全的重要性，提出了MetaSSC框架，结合可变形卷积和大核注意力，通过预训练任务获取可迁移知识，以降低部署成本并提升性能。

Towards 3D Semantic Scene Completion for Autonomous Driving: A Meta-Learning Framework Based on Deformable Large-Kernel Attention and the Mamba Model

BriefGPT - AI 论文速递 ·