小红花·文摘 - 小红花技术领袖俱乐部

Apache TVM 是一个支持 CPU 和 GPU 的深度学习编译框架。本文介绍了如何通过张量化和调度原语 tensorize 来优化性能，具体展示了矩阵乘法的实现及调度过程，并强调了内联函数的定义与使用。最终，教程演示了如何利用 tensorize 实现高效计算调度。

【TVM 教程】使用 Tensorize 来利用硬件内联函数

HyperAI超神经 ·

本研究提出了一种新方法，通过张量化长输入序列，解决长序列建模中的长范围依赖性和计算效率问题。实验结果表明，张量化的注意力机制显著提高了推断速度和扩展能力。

Long Sequence Modeling and Attention Tensorization: From Sequence to Tensor Learning

BriefGPT - AI 论文速递 ·