本研究提出了MiMo-7B模型,通过优化预训练和后训练阶段,显著提升了推理能力和任务性能,超越了更大模型。
本研究提出了一个评估软提示可解释性的理论框架,发现现有方法未能满足可解释性标准,并探索了优化训练提示的新方法,揭示了可解释性与任务性能之间的权衡。
本研究提出了AgentDropout方法,旨在提高基于大语言模型的多智能体系统的通信效率和任务性能。通过优化邻接矩阵,识别并消除冗余代理,实验结果表明,该方法使令牌消耗降低21.6%,任务表现提升1.14,验证了其有效性。
本文提出了一种好奇心扩散器,旨在解决机器人智能中神经网络模型的不稳定性和收敛性问题,从而降低实际应用中的安全风险。该方法通过随机网络蒸馏模块评估模型行为与训练数据的一致性,显著提升了任务性能。
本研究提出了xLSTM 7B,一种基于xLSTM架构的7亿参数大语言模型,旨在提高推理速度。该模型通过优化设计,显著提升了推理效率,同时保持了良好的任务性能,具有广泛的应用潜力。
选择合适的大语言模型(LLM)对特定任务至关重要。本文介绍了一种可重用的代码库,帮助用户系统比较多个开源LLM的输出,考虑任务性能、偏见、成本和泛化能力等因素。通过自动化测试框架,用户可以高效评估模型,优化工作流程,确保选择最佳模型。
本研究提出了SafeVLA算法,旨在解决视觉语言行动模型的安全挑战。该算法通过大型约束学习,在模拟环境中有效平衡安全性与任务性能,显著减少危险行为,并在安全性和任务表现上优于现有方法。此方法能够在多样化未知场景中推广学习到的安全约束,降低长尾风险。
本研究提出了一种新方法,通过大型语言模型生成多语言对话数据,有效解决开放领域对话模型的数据稀缺问题。该方法能够捕捉语言细微差别,某些任务的表现超过人类众包工作者,展现出良好的应用前景。
本研究提出了ARM4R自回归机器人模型,旨在解决机器人领域中有效表示和昂贵标注数据的问题。通过对人类视频学习的低级4D表示进行预训练,实现了高效的迁移学习,实验结果表明其在多种环境下的任务性能得到了提升。
本研究探讨大型语言模型中间层的潜力,认为中间层能够编码更丰富的特征,从而提升多种任务的性能。通过建立统一的表示质量度量框架,挑战了对最终层的传统重视,为模型分析与优化提供了新思路。
本研究探讨了多语种自然语言处理中的英语角色,指出其在任务性能与语言理解之间存在目标不一致,建议应重视增强语言理解,而非单纯依赖英语提升任务性能。
本研究提出DroidSpeak框架,旨在提高多智能体系统中大型语言模型(LLMs)之间的通信效率。通过使用中间数据,DroidSpeak实现了高达2.78倍的通信加速,同时保持任务性能,为构建更高效的多智能体系统提供了新思路。
本研究提出了一种新的对抗约束策略优化(ACPO)方法,旨在改善约束强化学习在任务性能与约束满足之间的平衡。实验结果表明,该方法在安全健身房和四足动物移动任务中优于常用基线。
人工智能中的多模态学习迅速发展,Ovis 1.6 通过视觉嵌入表对齐视觉和文本数据,解决嵌入不一致问题。在多项测试中表现优异,展示了其在复杂任务中的潜力。
本文介绍了一种新型机器人操作方法,利用物体运动学习和模拟运动演示奖励(SLDRs),通过强化学习提高机器人在多物体堆放和非刚性物体操作中的成功率和学习速度。该方法无需人类演示,采用深度强化学习框架和层次化策略,实现高效控制,显著提升任务性能和样本效率。
本文介绍了多种基于屏幕截图的图形用户界面(GUI)自动化方法,如SeeClick、Spotlight和ScreenAgent。研究表明,优化GUI定位能显著提升任务性能。同时,提出了新的预训练方法S4,增强了视觉语言模型的能力。CogAgent模型在GUI理解和导航方面表现优异,推动了相关技术的发展。
本文介绍了一种名为自适应模型融合(AdaMerging)的技术,该技术通过无监督学习自动优化模型融合系数,显著提升任务性能和泛化能力。实验表明,AdaMerging 在数据分布漂移情况下表现出更强的鲁棒性,并在多个数学任务中展现出优异的算术能力。
本文探讨了利用预训练的视觉语言模型(VLMs)作为强化学习代理的奖励来源,提出了BLIP和VLM-CaR等新框架,显著提升了视觉与语言任务的性能。研究表明,VLMs在复杂任务中展现出强大的泛化能力和鲁棒性,有效支持强化学习策略的训练。
本文比较了常规分类度量指标和更具特异性的度量指标,并证明了归一化信息性度量是任务性能的简约基准。通过实验,发现归一化信息性度量最能捕捉到理想模型特征。同时,发布了一个Python版本的归一化信息性度量。
该文献提出了一种将检索到的文档压缩为文本摘要的方法,以提高任务性能。该方法在语言建模和开放域问题回答任务中实现了最低为6%的压缩率,并能够迁移到其他语言模型。
完成下面两步后,将自动完成登录并继续当前操作。