小红花·文摘

本文探讨了苏老师关于旋转位置编码（RoPE）的文章，强调理解细节的重要性。通过分析三篇文章，深入讨论了公式解释和矩阵性质，尤其是正交矩阵的特性。作者赞赏苏老师的清晰表达，并希望更好掌握相关知识。

RoPE 的通解

学习让我快乐 ·

机器之心数据服务现已上线，提供高效稳定的数据获取服务，简化数据爬取流程。

ICML 2025 | 清华、上海AI Lab等提出傅里叶位置编码，多项任务远超RoPE

机器之心 ·

本文解决了现有旋转位置嵌入（RoPE）缺乏统一理论基础的问题，特别是在高维空间中。研究提出了基于李群和李代数理论的系统数学框架，识别了RoPE的两个核心属性，并在一维、二维及N维中推导了有效RoPE的通用约束与构造。此框架不仅统一了解释了现有RoPE设计，还为新模式和任务的扩展提供了原则性的支持。

重新思考RoPE：N维位置编码的数学蓝图

BriefGPT - AI 论文速递 ·

本研究解决了多模态扩散变换器中自注意力层对位置嵌入和查询-键相似性的依赖，提出了一种无训练的图像编辑框架，提升了图像编辑质量并保持了原始语义内容。

FreeFlux：理解和利用基于RoPE的MMDiT中的层特定角色以实现多功能图像编辑

BriefGPT - AI 论文速递 ·

本研究针对RoPE基础模型中的KV缓存优化难题，提出了EliteKV框架，支持可变的KV缓存压缩比。通过RoPElite识别每个注意力头的内在频率偏好，并对关键维度进行选择性线性恢复，实现了高效的KV缓存压缩，实验结果表明，该方法在仅使用0.6%的原始训练数据进行最小调整的情况下，可以将KV缓存大小减少75%，并在性能上保持微小的差距。

EliteKV：通过RoPE频率选择和联合低秩投影实现可扩展的KV缓存压缩

BriefGPT - AI 论文速递 ·

VideoRoPE是一种新的视频位置嵌入策略，扩展了RoPE在视频领域的应用，提升了长视频的理解和检索能力。它通过三维结构保留时空关系，采用低频时间分配、对角线布局和可调时间间隔，表现出更强的鲁棒性和适应性。

Llama都在用的RoPE有了视频版，长视频理解/检索绝佳拍档

量子位 ·

本研究提出了一种新算法，解决RoPE机制在注意力计算中的复杂性，结合多项式方法与快速傅里叶变换，实现子平方时间性能，提升Transformer架构效率。

几乎线性时间内快速计算RoPE注意力的梯度

BriefGPT - AI 论文速递 ·

本研究探讨了张量注意力和基于$\mathsf{RoPE}$的张量注意力的电路复杂性，揭示在多项式精度、常数深度层和线性或亚线性隐藏维度条件下，它们无法解决固定成员问题或$(A_{F,r})^*$闭合问题。这一发现揭示了张量注意力与经典矩阵注意力之间的差距，进而为基于理论的变换器模型设计和扩展提供了重要的指导。