小红花·文摘 - 小红花技术领袖俱乐部

本文提出了一种自适应多保真强化学习框架，旨在解决传统方法中因模型层级依赖导致的方差增加问题。该框架动态结合低保真和高保真模型，降低策略学习方差，提高收敛速度和解决方案质量，消除手动调节模型的需求。

Adaptive Multi-Fidelity Reinforcement Learning for Variance Reduction in Engineering Design Optimization

BriefGPT - AI 论文速递 ·

本文提出了一种自动化模型合并框架，克服了手动设计超参数合并策略的局限性。该框架利用多保真近似方法，支持单目标和多目标优化，能够在有限计算成本下自动发现有效的合并方案。

Okay, I'll merge it myself: A Multi-Fidelity Framework for Automated Model Merging

BriefGPT - AI 论文速递 ·