小红花·文摘

华人团队提出的“Memory Decoder”是一种新型预训练记忆模块，能有效提升Qwen和Llama模型在医学、法律和金融等领域的表现。与传统的DAPT和RAG方法相比，Memory Decoder成本低、效率高，避免了重新训练和实时检索的延迟。实验结果显示，使用该模块的模型困惑度平均降低6.17分，验证了其有效性。