小红花·文摘

本研究提出了一种新颖的随机重排列方法，旨在提高强化学习中经验重放的采样效率，增强学习的稳定性和样本效率。在Atari基准测试中，该方法优于传统技术。

随机重排列的经验重放

BriefGPT - AI 论文速递 ·

本研究探讨了自一致性在聚合多样性随机样本时的动态机制，提出了一种基于置信度的机制，通过动态调整解码温度来提高采样效率和准确性。实验结果表明，该方法在数学推理任务中优于固定多样性基准。

Revisiting the Role of Self-Consistency in Answer Aggregation from the Perspective of Dynamic Distributional Alignment

BriefGPT - AI 论文速递 ·

比知识蒸馏好用，田渊栋等提出连续概念混合，再度革新Transformer预训练框架

机器之心 ·

本研究提出了一种新的周期贝叶斯流方法CrysBFN，旨在解决晶体数据生成建模中的周期性物理对称性问题。实验结果表明，CrysBFN在晶体生成和结构预测任务中表现优异，显著提高了采样效率。

Application of Periodic Bayesian Flow in Material Generation

BriefGPT - AI 论文速递 ·

通过扭曲序列蒙特卡洛实现数学问题的逐步推理

Apple Machine Learning Research ·

本文识别了去噪模型训练损失中的奇点源，导致预测向源或目标分布均值归零。提出了一种新模型——线匹配模型（LMM），提高了采样效率和生成样本的保真度，在多个基准数据集上取得了先进的FID分数。

Generative Line Matching Model

BriefGPT - AI 论文速递 ·

该研究提出了新方法以提高扩散模型的采样效率和生成速度，包括分布匹配蒸馏和得分身份蒸馏。通过减少采样步骤和优化计算资源分配，显著提升了生成质量和速度，解决了扩散模型在图像生成中的计算开销问题。这些方法在多个数据集上取得了最先进的结果，具有重要的应用价值。

通过得分隐式匹配实现一步扩散蒸馏

BriefGPT - AI 论文速递 ·

本文介绍了多种基于蒙特卡洛方法的算法，如无转弯采样器和随机梯度贝克动力学，旨在提高复杂系统中采样的效率和准确性。这些方法在处理大数据集和模型不确定性方面表现优异，适用于细胞动力学和分子动力学等领域。

Doob的拉格朗日：一种样本有效的变分方法用于过渡路径采样

BriefGPT - AI 论文速递 ·

本文探讨了扩散模型的采样效率提升方法，包括基于指数积分器的快速采样、限制后向误差进度表（RBE）和ParaDiGMS方法。这些方法通过减少采样步骤和并行处理，显著提高了图像生成速度和质量，同时保持感知效果。此外，研究提出了新的收敛理论，改善了现有模型的收敛速度。

随机龙格-库塔方法：扩散模型的可证明加速

BriefGPT - AI 论文速递 ·

本文介绍了多种基于Boltzmann生成器的抽样方法，如等变流、FAB方法和iDEM算法。这些方法在高维离散数据处理和复杂分布生成中表现出色，提升了采样效率，克服了传统方法的局限性，为科学应用提供了新解决方案。

通过一致性模型实现有效且无偏的玻尔兹曼分布采样

BriefGPT - AI 论文速递 ·

本文介绍了DPM-Solver++，一种高效的扩散概率模型求解器，显著提高了图像生成的采样质量和速度。通过新方法和优化策略，该研究在多个数据集上实现了高品质图像生成，减少了去噪步骤，提升了采样效率。

DC-Solver：通过动态补偿改进预测-校正扩散采样器

BriefGPT - AI 论文速递 ·

本研究提出了预处理的Crank-Nicolson算法，用于解决贝叶斯神经网络在宽度增长时采样效率低的问题。该方法在网络宽度增加时具有更高的接受概率，且能更有效地抽样后验分布。研究表明，该方法在有效样本量和诊断结果上具有显著优势，对实际应用具有重要影响。

用于贝叶斯宽神经网络的函数空间MCMC

BriefGPT - AI 论文速递 ·

本文介绍了一系列基于扩散模型和GAN的图像合成技术，重点在于提高采样效率、实时生成高保真图像和模型训练收敛性。研究表明新模型在多种任务中表现优越，并提供了开源代码供使用。

SwiftBrush v2：让您的单步扩散模型超越其老师

BriefGPT - AI 论文速递 ·

本文介绍了扩散模型在图像生成中的新进展，包括通过参数化方法和并行去噪步骤提高采样效率，提出了多种加速算法，如ParaDiGMS和DiffRS，显著提升了采样速度和质量，并探讨了其应用及未来发展方向。

加速扩散模型取样的简单早期退出框架

BriefGPT - AI 论文速递 ·

本文探讨了基于组合结构的行为抽象在蒙特卡洛树搜索中的应用，提出了一种状态条件行为抽象方法，显著提高了采样效率。研究还介绍了新颖的技能生成方法和离散状态抽象模型，有效解决了稀疏回报强化学习中的探索问题，并在多个任务中优于传统方法。

决策变压器中的多状态动作令牌化在多离散动作空间中的应用

BriefGPT - AI 论文速递 ·

本研究提出了一种新型多目标强化学习算法PD-MORL，该算法通过偏好指导更新网络参数，并采用并行化方法提高采样效率，适用于连续机器人任务。实验验证了其在高自由度控制问题中的有效性，能够更高效地找到不同权衡解，并在多任务分类和回归问题上表现优越。

学习帕累托集合用于多目标连续机器人控制

BriefGPT - AI 论文速递 ·

本文探讨了动态感知奖励函数在偏好基础增强学习中的应用，显著提高了采样效率和策略学习速度。在多种机器人任务中，使用50个偏好标签的性能与500个标签相当，并恢复了较高的真实奖励策略性能。此外，提出了通过人机交互和自训练方法来优化奖励模型，克服了偏好强化学习中的挑战，提升了学习效率和鲁棒性。

通过对齐的经验估计实现高效的基于偏好的强化学习

BriefGPT - AI 论文速递 ·

本文提出了一种新的训练目标——等变流匹配，基于最优传输流匹配，利用对称性进行高效训练。研究表明，该方法在粒子系统和小分子中显著提高了采样效率，实现了无需定制特征的Boltzmann生成器。通过连续归一化流和线性插值，探讨了学习概率分布的理论属性，并建立了基于Wasserstein-2距离的误差界。

Verlet 流：流动式生成模型的精确似然积分器

BriefGPT - AI 论文速递 ·

本文探讨了主动学习中的标注成本和采样效率，提出了基于多样性原则的查询策略和自适应聚类算法D-CALM，显著提高了标注效率和模型性能。研究表明，结合大型语言模型（LLMs）与主动学习能够有效降低人工成本并提升决策效果。

面向主观 NLP 任务的标注者中心主动学习

BriefGPT - AI 论文速递 ·

本文介绍了一种名为CERL的可扩展框架，结合神经进化和强化学习，生成超越个体学习器的新兴学习器。实验表明，该学习器在连续控制基准测试中表现优异，具有更高的采样效率。同时，文章综述了进化强化学习的最新研究进展，探讨了不同算法的整合及未来研究方向。

演化强化学习的合作协同进化

BriefGPT - AI 论文速递 ·