小红花·文摘

AgentEvolver - 一个统一自我提问、自我导航的端到端训练框架，...

云原生 ·

本文介绍了UniToken，一种自回归生成模型，通过离散和连续表示组合编码视觉输入，实现统一的视觉理解与图像生成。UniToken框架能够捕捉高层语义和低层细节，提升多任务知识自适应能力，实验结果显示其在多个基准测试中表现优异，超越现有方法。

UniToken: Harmonizing Multimodal Understanding and Generation through Unified Visual Encoding

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法CS-ReFT，旨在解决大型语言模型在多任务适应中的交叉技能干扰问题。该方法通过学习正交子空间变换，提升了多任务指令执行能力，并在AlpacaEval基准测试中表现优异。

适应性大型语言模型的组合子空间表示微调

BriefGPT - AI 论文速递 ·

EDoRA方法通过奇异值分解将预训练权重分解为大小和方向分量，冷冻低秩矩阵，并引入小的可训练矩阵，显著减少可训练参数，最多可减少30倍，同时保持学习能力。实验表明，EDoRA在GLUE基准测试中表现优异，适用于资源受限环境的多任务适应。

EDoRA: Efficient Weight-Decomposed Low-Rank Adaptation via Singular Value Decomposition

BriefGPT - AI 论文速递 ·

本研究提出了一种动态轻量级插件DLP-LoRA，旨在解决大型语言模型在特定领域微调时的高资源消耗问题。通过使用仅5M参数的小型MLP模块，DLP-LoRA在句子层面动态融合多个LoRA，提高推理效率。实验结果显示，该方法在多个任务中表现优异，平均准确率达92.34%，并在问答数据集上显著提升BLEU和ROUGE分数，展现出高效的多任务适应能力。

DLP-LoRA: A Dynamic Lightweight Plugin for Efficient Task-Specific LoRA Integration in Large Language Models

BriefGPT - AI 论文速递 ·