小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
RLT——VLA引导的在线RL:极简MLP结构的Actor-Critic在“VLA浓缩Token感知与VLA参考动作先验”的双重加持下进行在线快速微调,最终从粗到细搞定拧螺丝和充电器插入

本文讨论了一种轻量级的在线强化学习方法,用于微调视觉-语言-动作模型。研究者通过引入“RL token”提高样本效率,使得模型能够快速适应真实世界任务。该方法结合冻结的VLA和小型actor-critic网络,优化关键任务阶段的表现,旨在实现高效的在线微调,同时保持泛化能力。

RLT——VLA引导的在线RL:极简MLP结构的Actor-Critic在“VLA浓缩Token感知与VLA参考动作先验”的双重加持下进行在线快速微调,最终从粗到细搞定拧螺丝和充电器插入

结构之法 算法之道
结构之法 算法之道 · 2026-03-26T03:44:34Z
精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

北京大学彭宇新团队提出了分类感知表征对齐方法TARA,旨在解决多模态大模型在生物类别分层识别中的挑战,提升细粒度和分层视觉识别的准确率。该方法通过对齐大模型与生物基础模型的表征,注入类别树知识,从而增强模型的识别能力。

精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

量子位
量子位 · 2026-03-21T09:48:18Z
MetaWorld——分层世界模型:融合 VLM 的语义推理能力、预测的未来动态环境、模仿学习的先验,及基于模型RL的对动态环境的在线自适应

本文介绍了MetaWorld,一个基于分层世界模型的机器人控制框架,旨在弥合高层语义理解与低层物理执行之间的鸿沟。该框架结合视觉-语言模型、模仿学习和强化学习的优势,通过分层架构进行任务解析和动作生成,提升机器人在动态环境中的适应性和泛化能力。

MetaWorld——分层世界模型:融合 VLM 的语义推理能力、预测的未来动态环境、模仿学习的先验,及基于模型RL的对动态环境的在线自适应

结构之法 算法之道
结构之法 算法之道 · 2026-02-07T10:14:29Z
Instantvir:实时视频逆问题求解器,提炼扩散先验实现超快速重建

研究团队开发了InstantViR框架,成功解决了实时高质量视频重建的难题。该系统通过简化视频扩散模型,实现每秒超过35帧的处理速度,重建质量优于现有技术,为视频会议和直播等应用带来了新机遇。

Instantvir:实时视频逆问题求解器,提炼扩散先验实现超快速重建

实时互动网
实时互动网 · 2025-11-20T07:08:51Z
MIT基于物理先验构建生成式AI模型,仅需单一光谱模态输入,达到实验相关性高达99%的跨模态光谱生成

MIT团队提出SpectroGen模型,通过物理先验生成高保真光谱,解决了传统材料表征效率低、成本高的问题,实现了材料发现与验证的同步,推动材料科学向新范式发展。

MIT基于物理先验构建生成式AI模型,仅需单一光谱模态输入,达到实验相关性高达99%的跨模态光谱生成

HyperAI超神经
HyperAI超神经 · 2025-10-23T05:43:11Z
DreamControl——结合扩散模型和RL的全身人形控制:利用在人体运动数据上训练得到的扩散先验,随后在仿真中引导RL策略完成特定任务

本文讨论了DreamControl,一种结合扩散模型与强化学习的全身类人机器人控制方法。该方法利用人类动作数据生成自然运动轨迹,提升机器人在复杂环境中的自主操作能力,解决了稳定性和协调性问题。研究表明,该方法在多种任务中有效,推动了人形机器人技术的发展。

DreamControl——结合扩散模型和RL的全身人形控制:利用在人体运动数据上训练得到的扩散先验,随后在仿真中引导RL策略完成特定任务

结构之法 算法之道
结构之法 算法之道 · 2025-10-03T16:01:40Z

Evo-0模型通过隐式注入3D几何先验,提升机器人对三维空间的理解,成功率提高31%。该方法无需额外传感器,利用VGGT提取3D信息,显著增强空间感知,训练效率高,适用于多种机器人任务。

机器人感知大升级!轻量化注入几何先验,成功率提升31%

量子位
量子位 · 2025-09-29T06:15:49Z
通过偏好对齐指导跨模态表示的多模态大语言模型先验

本文介绍了一种新框架MAPLE(基于偏好的模态对齐学习),通过多模态大语言模型(MLLM)指导跨模态表示学习。MAPLE利用MLLM的细粒度对齐先验,采用强化学习方法构建自动偏好数据,并引入相对偏好对齐损失(RPA),显著提升了跨模态检索效果,尤其在处理细微语义差异方面表现突出。

通过偏好对齐指导跨模态表示的多模态大语言模型先验

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-22T00:00:00Z

本研究针对现有面部图像压缩方法在低比特率下重建图像质量不佳的问题,提出了一种新的面部图像压缩方法FaSDiff。该方法通过高频敏感压缩器和低频增强模块相结合,有效保留面部图像的高频信息,从而在确保人类视觉效果的同时,降低机器视觉中的语义不一致性。实验表明,FaSDiff在提升人类视觉质量和机器视觉精度的平衡方面超过了现有的最先进方法。

面部图像压缩的保持一致性扩散先验方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-09T00:00:00Z

本研究解决了多模态大型语言模型(MLLMs)在视觉和语言深度对齐方面的挑战,指出这些模型往往未能充分利用视觉输入。论文提出新的技术,以加深模型对视觉内容的理解,并确保这些视觉洞察有效地指导语言生成,最终在视觉依赖的任务中实现显著的性能提升。

超越语言先验:提升多模态模型中的视觉理解和注意力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

本研究提出了一种新方法,通过引导大型语言模型不依赖先验知识,显著提高其在确定性任务中的准确性,并利用可解释性技术调整神经网络中的先验影响。

识别和缓解先验分布在大型语言模型中的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究针对强化学习在学习新任务时忽视先验知识的问题,提出了一种通过贝叶斯非参数模型有效捕捉技能多样性的先验知识方法。研究表明,使用这种灵活的技能先验,能够显著提升机器人的学习和执行能力,尤其是在复杂的长时域任务中,促进技能转移和任务成功。

预训练的贝叶斯非参数知识先验在机器人长时域强化学习中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

本研究提出了一种新的后训练偏好对齐方法,旨在缩小多智能体运动生成模型与人类偏好之间的差距。通过利用先前训练示范中的隐式反馈,显著提高了生成行为的真实性和一致性,无需额外的人类偏好注释。

通过先验示范中的隐式反馈实现多智能体运动生成模型的直接后训练偏好对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-25T00:00:00Z

本研究提出了一种新颖的插拔式朗之万取样方法,针对低光子泊松成像问题,结合边界反射和泊松似然近似,提高了成像模型的准确性与稳定性。

使用插拔式先验进行泊松逆问题的高效贝叶斯计算

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了一种变分贝叶斯推断框架(VINP),旨在解决混响语音信号的去混响和盲室冲激响应(RIR)识别问题。通过结合深度神经网络预测先验分布,显著提升了自动语音识别(ASR)和盲RIR识别的性能。

VINP:使用神经语音先验的变分贝叶斯推断用于联合ASR有效的语音去混响和盲RIR识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出PIPA框架,以统一理解语言模型的偏好对齐问题。通过最大似然估计,PIPA实现了3-10%的性能提升,并有效整合了先验信息。

优先对齐的先验信息统计估计研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-09T00:00:00Z

本研究针对现有单目神经形态相机在3D重建中的不足,提出了一种无物理先验的端到端方法。该方法引入了新颖的事件表示,增强了边缘特征学习的效果,并通过优化二值化阈值选择原则提供了未来研究的指导。实验结果表明,该方法的重建精度比基线方法提高了54.6%。

无物理先验的端到端神经形态体素3D物体重建

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-01T00:00:00Z

本研究探讨了提示调优中嵌入崩溃现象对模型性能的影响,发现嵌入先验显著影响调优位置,模型能够有效处理不同激活空间的嵌入,且生成轨迹超出模型激活空间,揭示了大规模语言模型的泛化能力。

探索提示调优中的嵌入先验以提高可解释性和控制力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本研究解决了现有面部超分辨率方法在像素级准确性方面的不足,提出了一种名为扩散先验插值(DPI)的新方法。通过引入强弱约束的遮罩策略与条件校正器,DPI能够平衡一致性与多样性,大幅提升面部超分辨率的表现,并在合成和真实数据集上的实验结果中展现出优于现有技术的效果。

面部超分辨率的扩散先验插值方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-21T00:00:00Z

本研究针对多元时间序列分类中存在的显著模式发现难题,提出了一种新颖的方法VSFormer,该方法结合了形状特征和数值信息。研究表明,通过提取特定类别的先验信息增强位置编码以及分类导向的自注意力学习,VSFormer在30个UEA数据集上达到了超越现有最优模型的性能。

VSFormer:基于先验增强自注意力的价值和形状感知变换器用于多元时间序列分类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-21T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码