小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了MiMo-7B模型,通过优化预训练和后训练阶段,显著提升了推理能力和任务性能,超越了更大模型。

MiMo: Unlocking the Reasoning Potential of Language Models - From Pre-training to Fine-tuning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-12T00:00:00Z

本研究提出了一个评估软提示可解释性的理论框架,发现现有方法未能满足可解释性标准,并探索了优化训练提示的新方法,揭示了可解释性与任务性能之间的权衡。

Towards Interpretable Soft Prompts

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究提出了AgentDropout方法,旨在提高基于大语言模型的多智能体系统的通信效率和任务性能。通过优化邻接矩阵,识别并消除冗余代理,实验结果表明,该方法使令牌消耗降低21.6%,任务表现提升1.14,验证了其有效性。

AgentDropout: Dynamic Agent Elimination for Token Efficiency and High Performance

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-24T00:00:00Z

本文提出了一种好奇心扩散器,旨在解决机器人智能中神经网络模型的不稳定性和收敛性问题,从而降低实际应用中的安全风险。该方法通过随机网络蒸馏模块评估模型行为与训练数据的一致性,显著提升了任务性能。

Curiosity Diffuser: Diffusion Models Guided by Reliability

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

本研究提出了xLSTM 7B,一种基于xLSTM架构的7亿参数大语言模型,旨在提高推理速度。该模型通过优化设计,显著提升了推理效率,同时保持了良好的任务性能,具有广泛的应用潜力。

xLSTM 7B: A Recurrent Large Language Model for Fast and Efficient Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
比较大语言模型以优化成本和响应质量

选择合适的大语言模型(LLM)对特定任务至关重要。本文介绍了一种可重用的代码库,帮助用户系统比较多个开源LLM的输出,考虑任务性能、偏见、成本和泛化能力等因素。通过自动化测试框架,用户可以高效评估模型,优化工作流程,确保选择最佳模型。

比较大语言模型以优化成本和响应质量

DEV Community
DEV Community · 2025-03-11T14:39:43Z

本研究提出了SafeVLA算法,旨在解决视觉语言行动模型的安全挑战。该算法通过大型约束学习,在模拟环境中有效平衡安全性与任务性能,显著减少危险行为,并在安全性和任务表现上优于现有方法。此方法能够在多样化未知场景中推广学习到的安全约束,降低长尾风险。

SafeVLA: Achieving Safety Alignment of Vision-Language-Action Models via Safe Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-05T00:00:00Z

本研究提出了一种新方法,通过大型语言模型生成多语言对话数据,有效解决开放领域对话模型的数据稀缺问题。该方法能够捕捉语言细微差别,某些任务的表现超过人类众包工作者,展现出良好的应用前景。

Open Source Large Language Models as Multilingual Crowdsourcers: Synthesizing Open-Domain Dialogue in Multiple Languages Without Target Examples or Machine Translation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-05T00:00:00Z

本研究提出了ARM4R自回归机器人模型,旨在解决机器人领域中有效表示和昂贵标注数据的问题。通过对人类视频学习的低级4D表示进行预训练,实现了高效的迁移学习,实验结果表明其在多种环境下的任务性能得到了提升。

基于4D表示的自回归机器人模型预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究探讨大型语言模型中间层的潜力,认为中间层能够编码更丰富的特征,从而提升多种任务的性能。通过建立统一的表示质量度量框架,挑战了对最终层的传统重视,为模型分析与优化提供了新思路。

Exploring Hidden Representations in Language Models Layer by Layer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

本研究探讨了多语种自然语言处理中的英语角色,指出其在任务性能与语言理解之间存在目标不一致,建议应重视增强语言理解,而非单纯依赖英语提升任务性能。

Evaluating the Role of English in Multilingual Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本研究提出DroidSpeak框架,旨在提高多智能体系统中大型语言模型(LLMs)之间的通信效率。通过使用中间数据,DroidSpeak实现了高达2.78倍的通信加速,同时保持任务性能,为构建更高效的多智能体系统提供了新思路。

DroidSpeak: Enhancing Communication Across Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

本研究提出了一种新的对抗约束策略优化(ACPO)方法,旨在改善约束强化学习在任务性能与约束满足之间的平衡。实验结果表明,该方法在安全健身房和四足动物移动任务中优于常用基线。

Adversarial Constrained Policy Optimization: Improving Constrained Reinforcement Learning by Adjusting Budgets

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z
Ovis 1.6:一种开源多模态大型语言模型 (MLLM) 架构,旨在结构化地对齐视觉和文本嵌入

人工智能中的多模态学习迅速发展,Ovis 1.6 通过视觉嵌入表对齐视觉和文本数据,解决嵌入不一致问题。在多项测试中表现优异,展示了其在复杂任务中的潜力。

Ovis 1.6:一种开源多模态大型语言模型 (MLLM) 架构,旨在结构化地对齐视觉和文本嵌入

实时互动网
实时互动网 · 2024-09-30T01:31:55Z

本文介绍了一种新型机器人操作方法,利用物体运动学习和模拟运动演示奖励(SLDRs),通过强化学习提高机器人在多物体堆放和非刚性物体操作中的成功率和学习速度。该方法无需人类演示,采用深度强化学习框架和层次化策略,实现高效控制,显著提升任务性能和样本效率。

机器人关键帧技术:通过混合密集和稀疏奖励学习定向运动

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z

本文介绍了多种基于屏幕截图的图形用户界面(GUI)自动化方法,如SeeClick、Spotlight和ScreenAgent。研究表明,优化GUI定位能显著提升任务性能。同时,提出了新的预训练方法S4,增强了视觉语言模型的能力。CogAgent模型在GUI理解和导航方面表现优异,推动了相关技术的发展。

随地阅读:具备布局感知的 GUI 屏幕阅读与镜头树定位

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

本文介绍了一种名为自适应模型融合(AdaMerging)的技术,该技术通过无监督学习自动优化模型融合系数,显著提升任务性能和泛化能力。实验表明,AdaMerging 在数据分布漂移情况下表现出更强的鲁棒性,并在多个数学任务中展现出优异的算术能力。

MetaGPT: 使用模型专属任务算法合并大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z

本文探讨了利用预训练的视觉语言模型(VLMs)作为强化学习代理的奖励来源,提出了BLIP和VLM-CaR等新框架,显著提升了视觉与语言任务的性能。研究表明,VLMs在复杂任务中展现出强大的泛化能力和鲁棒性,有效支持强化学习策略的训练。

VLRM:视觉语言模型用作图像字幕的奖励模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z

本文比较了常规分类度量指标和更具特异性的度量指标,并证明了归一化信息性度量是任务性能的简约基准。通过实验,发现归一化信息性度量最能捕捉到理想模型特征。同时,发布了一个Python版本的归一化信息性度量。

自然语言处理中的分类评估指标问题讨论

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-08T00:00:00Z

该文献提出了一种将检索到的文档压缩为文本摘要的方法,以提高任务性能。该方法在语言建模和开放域问题回答任务中实现了最低为6%的压缩率,并能够迁移到其他语言模型。

RECOMP: 通过压缩和选择性增强改进基于检索的语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-06T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码