小红花·文摘

语音增强中的自监督学习：从无配对训练到基础模型先验

实时互动网 ·

RLT——VLA引导的在线RL：极简MLP结构的Actor-Critic在“VLA浓缩Token感知与VLA参考动作先验”的双重加持下进行在线快速微调，最终从粗到细搞定拧螺丝和充电器插入

结构之法算法之道 ·

精准识别「界门纲目科属种」！北大彭宇新团队用细粒度树先验提升泛化，破解生物类别分层识别难题

量子位 ·

$MetaWorld——分层世界模型：融合 VLM 的语义推理能力、预测的未来动态环境、模仿学习的先验，及基于模型RL的对动态环境的在线自适应$

MetaWorld——分层世界模型：融合 VLM 的语义推理能力、预测的未来动态环境、模仿学习的先验，及基于模型RL的对动态环境的在线自适应

结构之法算法之道 ·

Instantvir：实时视频逆问题求解器，提炼扩散先验实现超快速重建

实时互动网 ·

MIT基于物理先验构建生成式AI模型，仅需单一光谱模态输入，达到实验相关性高达99%的跨模态光谱生成

HyperAI超神经 ·

$DreamControl——结合扩散模型和RL的全身人形控制：利用在人体运动数据上训练得到的扩散先验，随后在仿真中引导RL策略完成特定任务$

DreamControl——结合扩散模型和RL的全身人形控制：利用在人体运动数据上训练得到的扩散先验，随后在仿真中引导RL策略完成特定任务

结构之法算法之道 ·

Evo-0模型通过隐式注入3D几何先验，提升机器人对三维空间的理解，成功率提高31%。该方法无需额外传感器，利用VGGT提取3D信息，显著增强空间感知，训练效率高，适用于多种机器人任务。

机器人感知大升级！轻量化注入几何先验，成功率提升31%

量子位 ·

通过偏好对齐指导跨模态表示的多模态大语言模型先验

Apple Machine Learning Research ·

本研究针对现有面部图像压缩方法在低比特率下重建图像质量不佳的问题，提出了一种新的面部图像压缩方法FaSDiff。该方法通过高频敏感压缩器和低频增强模块相结合，有效保留面部图像的高频信息，从而在确保人类视觉效果的同时，降低机器视觉中的语义不一致性。实验表明，FaSDiff在提升人类视觉质量和机器视觉精度的平衡方面超过了现有的最先进方法。

面部图像压缩的保持一致性扩散先验方法

BriefGPT - AI 论文速递 ·

本研究解决了多模态大型语言模型（MLLMs）在视觉和语言深度对齐方面的挑战，指出这些模型往往未能充分利用视觉输入。论文提出新的技术，以加深模型对视觉内容的理解，并确保这些视觉洞察有效地指导语言生成，最终在视觉依赖的任务中实现显著的性能提升。

超越语言先验：提升多模态模型中的视觉理解和注意力

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，通过引导大型语言模型不依赖先验知识，显著提高其在确定性任务中的准确性，并利用可解释性技术调整神经网络中的先验影响。

识别和缓解先验分布在大型语言模型中的影响

BriefGPT - AI 论文速递 ·

本研究针对强化学习在学习新任务时忽视先验知识的问题，提出了一种通过贝叶斯非参数模型有效捕捉技能多样性的先验知识方法。研究表明，使用这种灵活的技能先验，能够显著提升机器人的学习和执行能力，尤其是在复杂的长时域任务中，促进技能转移和任务成功。

预训练的贝叶斯非参数知识先验在机器人长时域强化学习中的应用

BriefGPT - AI 论文速递 ·

本研究提出了一种新的后训练偏好对齐方法，旨在缩小多智能体运动生成模型与人类偏好之间的差距。通过利用先前训练示范中的隐式反馈，显著提高了生成行为的真实性和一致性，无需额外的人类偏好注释。

通过先验示范中的隐式反馈实现多智能体运动生成模型的直接后训练偏好对齐

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的插拔式朗之万取样方法，针对低光子泊松成像问题，结合边界反射和泊松似然近似，提高了成像模型的准确性与稳定性。

使用插拔式先验进行泊松逆问题的高效贝叶斯计算

BriefGPT - AI 论文速递 ·

本研究提出了一种变分贝叶斯推断框架（VINP），旨在解决混响语音信号的去混响和盲室冲激响应（RIR）识别问题。通过结合深度神经网络预测先验分布，显著提升了自动语音识别（ASR）和盲RIR识别的性能。

VINP：使用神经语音先验的变分贝叶斯推断用于联合ASR有效的语音去混响和盲RIR识别

BriefGPT - AI 论文速递 ·

本研究提出PIPA框架，以统一理解语言模型的偏好对齐问题。通过最大似然估计，PIPA实现了3-10%的性能提升，并有效整合了先验信息。

优先对齐的先验信息统计估计研究

BriefGPT - AI 论文速递 ·

本研究针对现有单目神经形态相机在3D重建中的不足，提出了一种无物理先验的端到端方法。该方法引入了新颖的事件表示，增强了边缘特征学习的效果，并通过优化二值化阈值选择原则提供了未来研究的指导。实验结果表明，该方法的重建精度比基线方法提高了54.6%。

无物理先验的端到端神经形态体素3D物体重建

BriefGPT - AI 论文速递 ·

本研究探讨了提示调优中嵌入崩溃现象对模型性能的影响，发现嵌入先验显著影响调优位置，模型能够有效处理不同激活空间的嵌入，且生成轨迹超出模型激活空间，揭示了大规模语言模型的泛化能力。

探索提示调优中的嵌入先验以提高可解释性和控制力

BriefGPT - AI 论文速递 ·

本研究解决了现有面部超分辨率方法在像素级准确性方面的不足，提出了一种名为扩散先验插值（DPI）的新方法。通过引入强弱约束的遮罩策略与条件校正器，DPI能够平衡一致性与多样性，大幅提升面部超分辨率的表现，并在合成和真实数据集上的实验结果中展现出优于现有技术的效果。

面部超分辨率的扩散先验插值方法

BriefGPT - AI 论文速递 ·