小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种新颖的随机重排列方法,旨在提高强化学习中经验重放的采样效率,增强学习的稳定性和样本效率。在Atari基准测试中,该方法优于传统技术。

随机重排列的经验重放

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z

本研究探讨了自一致性在聚合多样性随机样本时的动态机制,提出了一种基于置信度的机制,通过动态调整解码温度来提高采样效率和准确性。实验结果表明,该方法在数学推理任务中优于固定多样性基准。

Revisiting the Role of Self-Consistency in Answer Aggregation from the Perspective of Dynamic Distributional Alignment

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-27T00:00:00Z
比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

Meta提出的CoCoMix框架结合稀疏自编码器和连续概念,提升了大型语言模型(LLMs)的性能,减少了21.5%的训练token,显示出更高的采样效率和可解释性。

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

机器之心
机器之心 · 2025-02-16T12:37:07Z

本研究提出了一种新的周期贝叶斯流方法CrysBFN,旨在解决晶体数据生成建模中的周期性物理对称性问题。实验结果表明,CrysBFN在晶体生成和结构预测任务中表现优异,显著提高了采样效率。

Application of Periodic Bayesian Flow in Material Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z
通过扭曲序列蒙特卡洛实现数学问题的逐步推理

本文提出了一种基于扭曲序列蒙特卡洛(TSMC)的新验证方法,旨在提升大型语言模型(LLMs)的多步推理能力。该方法通过聚焦有前景的候选项,提高采样效率,减少样本需求,并简化训练目标,降低对人工标注的依赖。实验结果显示,该方法在多个数学基准上表现优越。

通过扭曲序列蒙特卡洛实现数学问题的逐步推理

Apple Machine Learning Research
Apple Machine Learning Research · 2025-02-01T00:00:00Z

本文识别了去噪模型训练损失中的奇点源,导致预测向源或目标分布均值归零。提出了一种新模型——线匹配模型(LMM),提高了采样效率和生成样本的保真度,在多个基准数据集上取得了先进的FID分数。

Generative Line Matching Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

该研究提出了新方法以提高扩散模型的采样效率和生成速度,包括分布匹配蒸馏和得分身份蒸馏。通过减少采样步骤和优化计算资源分配,显著提升了生成质量和速度,解决了扩散模型在图像生成中的计算开销问题。这些方法在多个数据集上取得了最先进的结果,具有重要的应用价值。

通过得分隐式匹配实现一步扩散蒸馏

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-22T00:00:00Z

本文介绍了多种基于蒙特卡洛方法的算法,如无转弯采样器和随机梯度贝克动力学,旨在提高复杂系统中采样的效率和准确性。这些方法在处理大数据集和模型不确定性方面表现优异,适用于细胞动力学和分子动力学等领域。

Doob的拉格朗日:一种样本有效的变分方法用于过渡路径采样

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本文探讨了扩散模型的采样效率提升方法,包括基于指数积分器的快速采样、限制后向误差进度表(RBE)和ParaDiGMS方法。这些方法通过减少采样步骤和并行处理,显著提高了图像生成速度和质量,同时保持感知效果。此外,研究提出了新的收敛理论,改善了现有模型的收敛速度。

随机龙格-库塔方法:扩散模型的可证明加速

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本文介绍了多种基于Boltzmann生成器的抽样方法,如等变流、FAB方法和iDEM算法。这些方法在高维离散数据处理和复杂分布生成中表现出色,提升了采样效率,克服了传统方法的局限性,为科学应用提供了新解决方案。

通过一致性模型实现有效且无偏的玻尔兹曼分布采样

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z

本文介绍了DPM-Solver++,一种高效的扩散概率模型求解器,显著提高了图像生成的采样质量和速度。通过新方法和优化策略,该研究在多个数据集上实现了高品质图像生成,减少了去噪步骤,提升了采样效率。

DC-Solver:通过动态补偿改进预测-校正扩散采样器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-05T00:00:00Z

本研究提出了预处理的Crank-Nicolson算法,用于解决贝叶斯神经网络在宽度增长时采样效率低的问题。该方法在网络宽度增加时具有更高的接受概率,且能更有效地抽样后验分布。研究表明,该方法在有效样本量和诊断结果上具有显著优势,对实际应用具有重要影响。

用于贝叶斯宽神经网络的函数空间MCMC

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

本文介绍了一系列基于扩散模型和GAN的图像合成技术,重点在于提高采样效率、实时生成高保真图像和模型训练收敛性。研究表明新模型在多种任务中表现优越,并提供了开源代码供使用。

SwiftBrush v2:让您的单步扩散模型超越其老师

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-26T00:00:00Z

本文介绍了扩散模型在图像生成中的新进展,包括通过参数化方法和并行去噪步骤提高采样效率,提出了多种加速算法,如ParaDiGMS和DiffRS,显著提升了采样速度和质量,并探讨了其应用及未来发展方向。

加速扩散模型取样的简单早期退出框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-12T00:00:00Z

本文探讨了基于组合结构的行为抽象在蒙特卡洛树搜索中的应用,提出了一种状态条件行为抽象方法,显著提高了采样效率。研究还介绍了新颖的技能生成方法和离散状态抽象模型,有效解决了稀疏回报强化学习中的探索问题,并在多个任务中优于传统方法。

决策变压器中的多状态动作令牌化在多离散动作空间中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-01T00:00:00Z

本研究提出了一种新型多目标强化学习算法PD-MORL,该算法通过偏好指导更新网络参数,并采用并行化方法提高采样效率,适用于连续机器人任务。实验验证了其在高自由度控制问题中的有效性,能够更高效地找到不同权衡解,并在多任务分类和回归问题上表现优越。

学习帕累托集合用于多目标连续机器人控制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

本文探讨了动态感知奖励函数在偏好基础增强学习中的应用,显著提高了采样效率和策略学习速度。在多种机器人任务中,使用50个偏好标签的性能与500个标签相当,并恢复了较高的真实奖励策略性能。此外,提出了通过人机交互和自训练方法来优化奖励模型,克服了偏好强化学习中的挑战,提升了学习效率和鲁棒性。

通过对齐的经验估计实现高效的基于偏好的强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-29T00:00:00Z

本文提出了一种新的训练目标——等变流匹配,基于最优传输流匹配,利用对称性进行高效训练。研究表明,该方法在粒子系统和小分子中显著提高了采样效率,实现了无需定制特征的Boltzmann生成器。通过连续归一化流和线性插值,探讨了学习概率分布的理论属性,并建立了基于Wasserstein-2距离的误差界。

Verlet 流:流动式生成模型的精确似然积分器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-05T00:00:00Z

本文探讨了主动学习中的标注成本和采样效率,提出了基于多样性原则的查询策略和自适应聚类算法D-CALM,显著提高了标注效率和模型性能。研究表明,结合大型语言模型(LLMs)与主动学习能够有效降低人工成本并提升决策效果。

面向主观 NLP 任务的标注者中心主动学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-24T00:00:00Z

本文介绍了一种名为CERL的可扩展框架,结合神经进化和强化学习,生成超越个体学习器的新兴学习器。实验表明,该学习器在连续控制基准测试中表现优异,具有更高的采样效率。同时,文章综述了进化强化学习的最新研究进展,探讨了不同算法的整合及未来研究方向。

演化强化学习的合作协同进化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-23T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码