The New Stack ·

注意力机制之后是什么？这家初创公司表示它已经知道了。

💡 原文英文，约1800词，阅读约需7分钟。

📝

内容提要

Subquadratic推出了小型模型SubQ 1.1，采用稀疏注意机制，能够处理长达1200万标记的上下文，显著提高计算效率。该模型在长上下文检索方面表现优异，适合企业数据处理需求。公司计划逐步向公众开放模型，并探索更高效的架构。

🎯

🔎

SubQ 1.1模型采用稀疏注意机制，能够显著降低计算资源消耗，尤其在处理长上下文时表现优异。这种机制使得模型在面对1200万标记的上下文时，计算效率提高近1000倍，适合企业在大规模数据处理中的应用。

Subquadratic的SubQ 1.1模型主要面向企业市场，尤其是在需要处理大量数据的场景中。随着企业对高效数据检索的需求增加，该模型的推出可能会为企业提供更具竞争力的解决方案，帮助他们更好地管理和分析数据。

尽管SubQ 1.1目前基于稀疏注意机制，但Subquadratic的目标是探索非注意架构。这表明公司在未来可能会推出更高效的模型，进一步推动自然语言处理技术的发展，值得关注其后续动态。

❓

SubQ 1.1模型采用稀疏注意机制，能够处理长达1200万标记的上下文，并在长上下文检索方面表现优异。

稀疏注意机制的计算资源使用比密集注意机制少64.5倍，且在处理长上下文时效率显著提高。

该模型主要面向企业市场，适合处理大规模数据和长上下文检索任务。

公司计划逐步向公众开放模型，并探索更高效的非注意架构。

在长上下文检索测试中，SubQ 1.1得分接近完美，尤其在1百万到1200万标记的测试中表现突出。

Subquadratic计划推出中型模型，预计在其层级中超越大多数竞争对手，但短期内会采取战略性发展。

🏷️