小红花·文摘

终身学习智能体+Loop工程五步法 | 附调参示例

极道 ·

天下苦「调参」久矣！MIT师生推出全新RandOpt算法

量子位 ·

本研究提出了一种新的ReLU-based Preference Optimization (RePO)算法，旨在解决大型语言模型与人类偏好对齐中的计算和稳定性问题。RePO简化了调参过程，提升了模型性能，实验证明其在多个基础模型上优于现有方法DPO和SimPO。

RePO: ReLU-based Preference Optimization

BriefGPT - AI 论文速递 ·

视频编解码算法优化的三大法宝：移植，调参和测试

实时互动网 ·

本文探讨了自适应控制方法在自主水下航行器（AUV）中的应用，包括基于学习的控制策略、模型预测控制（MPPI）和分布式鲁棒学习控制策略。研究表明，这些方法能有效提高控制性能，处理不确定性和环境干扰。

基于交叉熵深度学习的 PID 调参：一种李雅普诺夫稳定性分析

BriefGPT - AI 论文速递 ·

本文介绍了使用Python进行机器学习模型调参和优化的方法，包括参数查找方法、集成优化方法、自动化调参工具、模型功能评价与调参结果分析、模型解释与进一步优化、模型解释与可解释性、模型部署与实践应用等内容。通过本文的学习，读者可以全面了解机器学习模型调参和优化的流程，掌握常用的调参方法和工具，并了解模型功能评价、解释性分析以及模型部署等相关技能。

使用Python进行机器学习模型的调参与优化

六虎 ·

通过 Tune without Validation（Twin）管道，我们介绍了一种可以在没有验证集的情况下调整学习率和权重衰减的方法。我们利用最近关于假设空间中学习阶段的理论框架来设计一种启发式算法，该算法可以预测哪些超参数组合能够获得更好的泛化效果。通过网格搜索和早停 / 非早停调度器，Twin...

无验证的调参：在训练集上搜索学习率和权重衰减

BriefGPT - AI 论文速递 ·

本文介绍了SafeOpt算法，用于解决调参中的安全失败问题。该算法通过高斯过程建模性能度量，并自动优化控制器参数，实现快速、自动和安全的优化。实验数据表明，该方法可以快速、自动、安全地优化控制器参数。

安全多任务贝叶斯优化

BriefGPT - AI 论文速递 ·

PID控制器示例代码展示了如何通过比例（Kp）、积分（Ki）和微分（Kd）参数计算控制信号。调参建议包括逐步调整Kp以确保系统稳定，设置Ki以减小稳态误差，以及调整Kd以减少超调和振荡。实际应用中需结合系统特性优化参数。

PID控制器的C语言示例代码，Kp,Ki,Kd参数的调参建议

茜文的博客 ·