小红花·文摘

上下文窗口溢出：是什么以及如何解决

Redis Blog ·

本研究提出了动态修剪的消息传递网络(DPMPN)和混合图网络(HGN)模型，以提升知识图谱推理性能。这些模型通过图形式的注意力机制和统一图结构，有效解决了边缘稀疏和嘈杂问题，并在多个基准测试中表现优异。此外，研究探讨了大型语言模型在图形推理中的应用，提出的新提示技术PathCompare显著提高了推理性能。

增强上下文的序列图推理框架

BriefGPT - AI 论文速递 ·

本研究提出了一种动态数据集修剪方法，解决了对比预训练中的数据效率问题。实验结果表明，该方法在多个下游数据集上优于传统静态选择方法。

SCAN: A Contrastive Pre-training Initialization Method for Data Efficiency

BriefGPT - AI 论文速递 ·

本研究提出了一种动态修剪词汇的方法，以提高大型语言模型的推理效率，解决了词汇量大带来的计算成本问题，同时保持模型性能。这一发现有望显著提升实际应用中的推理效率。

早期退出的动态词汇修剪

BriefGPT - AI 论文速递 ·

深度学习的复杂模型需要高效的稀疏化技术。贝叶斯稀疏化方法能够提高计算效率和模型性能，研究表明其在参数修剪方面优于现有方案，适用于多种深度学习架构。通过结构化剪枝和动态修剪，研究实现了显著的加速和性能提升，同时降低了存储和计算成本。

BMRS：结构化剪枝的贝叶斯模型简化

BriefGPT - AI 论文速递 ·