小红花·文摘

本研究探讨了检索增强生成（RAG）系统在上下文大小和语言模型选择上的问题，发现最佳问答表现依赖于最多15个片段，不同领域模型表现差异显著，尤其在生物医学和百科全书领域。研究为RAG系统的改进提供了指导。

上下文大小和模型选择对检索增强生成系统的影响

BriefGPT - AI 论文速递 ·

本研究提出了一种自我注意力机制，显著扩展了Transformer的上下文大小，同时控制内存和计算时间。在字符级语言建模任务中，使用8k字符实现了先进性能。研究分析了Transformer的注意力结构，发现其在不同层次关注不同词性和依赖关系。通过引入新的注意力机制，提升了模型的性能和可解释性，解决了无上下文语言建模的限制。

选择性注意力改善变压器模型

BriefGPT - AI 论文速递 ·