小红花·文摘

本研究提出了一种基于量子加权张量混合网络的高效微调方法，克服了经典低秩适应在复杂任务中的局限性。该方法在大型模型微调中减少了76%的参数，训练损失比传统LoRA降低了15%。

BriefGPT - AI 论文速递 ·

DEV Community ·

本研究提出了一种新技术DeltaLLM，通过在Transformer层之间共享权重和添加低秩差异矩阵，减少约12%的参数，同时保持90%的性能，有效解决大型语言模型的内存占用问题。

BriefGPT - AI 论文速递 ·

研究表明，Transformer模型中的多层感知器（MLP）可能不是必需的。通过计算机视觉测试，简化后的Transformer在去除MLP、合并矩阵和使用对称相似度矩阵后，参数减少90%，性能仍与原始模型相似。

BriefGPT - AI 论文速递 ·

本研究提出了一种自监督学习框架，通过训练适配器将不同视角的特征映射到统一空间，解决交叉视图地理定位挑战。实验证明该方法在减少参数和仅使用无标签数据的情况下，相较于标准模型和有监督方法，性能有显著改进，并具有广泛应用潜力。

BriefGPT - AI 论文速递 ·

BriefGPT - AI 论文速递 ·

本文介绍了一种高效、小型、低参数的机器学习架构，适用于中小型基站和边缘设备，通过实验和优化，成功减少了模型参数和尺寸，提高了训练速度和准确度。

BriefGPT - AI 论文速递 ·