小红花·文摘

本文讨论了卷积神经网络（CNN）的架构和训练方法，包括归一化层、正则化（如Dropout）、激活函数（如ReLU和GELU）、残差网络（ResNet）和权重初始化（Kaiming初始化）。还介绍了数据预处理、数据增强、迁移学习策略及超参数优化步骤，强调系统调试的重要性，指出大多数失败源于基本设置问题，而非超参数选择。

CS231n 讲义 VI：卷积神经网络架构与训练

Louis Aeilot's Blog ·

中级机器学习从业者必备的5个Python脚本

MachineLearningMastery.com ·

Kubeflow推动云原生AI：2025年KubeCon + CloudNativeCon欧洲大会的展望

Cloud Native Computing Foundation ·

PnPXAI框架解决了现有可解释人工智能（XAI）在不同神经网络和数据模式下的局限性。该框架能够自动检测模型架构、推荐解释方法并优化超参数，从而提升了解释的灵活性和有效性，适用于医疗和金融等多个领域。

PnPXAI: A Universal Explainable AI Framework for Providing Automatic Explanations Across Diverse Modalities and Models

BriefGPT - AI 论文速递 ·

本研究提出MaxUCB方法，旨在解决自动化机器学习中的算法选择和超参数优化的资源配置问题。该方法在轻尾和有界奖励分布下表现优异，效率高于传统方法。

在强盗问题中使用CASH：面向自动化机器学习的最大K臂问题

BriefGPT - AI 论文速递 ·

本研究评估了四种超参数优化策略对八种生成模型的影响，结果表明优化提高了合成数据的质量，但需结合领域知识以确保其临床有效性。

Generating Reliable Synthetic Clinical Trial Data: The Role of Hyperparameter Optimization and Domain Constraints

BriefGPT - AI 论文速递 ·

本研究深入探讨了检索增强生成（RAG）的超参数优化，填补了现有方法缺乏基准测试的空白。结果表明，贪婪或迭代随机搜索能有效提升RAG性能，优先优化模型效果更佳。

检索增强生成的超参数优化方法分析

BriefGPT - AI 论文速递 ·

结合Optuna进行PyTorch Lightning的超参数优化

MachineLearningMastery.com ·

本研究提出了一种新颖的超参数优化方法，通过引入训练层数作为保真度来源，显著节约了计算和内存资源，推动了多保真度超参数优化算法的发展。

冻结层：节省内存的多保真度超参数优化

BriefGPT - AI 论文速递 ·

本研究提出了一种新的超参数优化方法，结合线性代理模型与遗传算法，以解决探索与利用的平衡问题。实验结果表明，该方法平均性能提升1.89%，最大提升6.55%。

快速遗传探索与代理利用的平衡方法用于超参数优化

BriefGPT - AI 论文速递 ·

如何使用Optuna进行Scikit-learn的超参数优化

MachineLearningMastery.com ·

本研究探讨了强化学习中的超参数优化，重点分析概率课程学习（PCL）中的高效调优。通过结合SHAP工具，研究超参数相互作用对PCL性能的影响，并提出优化搜索空间的策略，以提高超参数优化的效率和实用性。

具有实用可解释性和解释方法的概率课程学习中的超参数优化

BriefGPT - AI 论文速递 ·

本研究探讨了大型语言模型（LLMs）在神经网络超参数优化中的应用。通过微调的Code Llama，我们的方法在生成超参数建议方面高效且具有竞争力，显著降低了计算开销，并在根均方误差（RMSE）上表现优异，展示了LLMs在快速实验中的潜力。

Optuna vs Code Llama: Are Large Language Models a New Paradigm for Hyperparameter Tuning?

BriefGPT - AI 论文速递 ·

Neural DSL v0.2.5 更新：探索多框架超参数优化功能

DEV Community ·

跨框架超参数优化变得简单 - Neural DSL v0.2.3

DEV Community ·

百万美金炼出「调参秘籍」！阶跃星辰开源LLM最优超参工具

机器之心 ·

本研究提出了HyperSHAP框架，解决超参数优化中的可解释性问题。通过加性分解性能度量，提供超参数的重要性及其交互作用的解释，强调低阶交互对模型性能可解释性的提升。

HyperSHAP: Shapley Values and Interactions for Hyperparameter Importance

BriefGPT - AI 论文速递 ·

本文提出了一种基于预训练的迁移学习框架，通过共享超网络微调语言模型，支持语言和视觉任务。研究探讨了超参数优化对模型性能的影响，提出了CARBS算法和LOMO优化器，以降低内存使用并提高效率。此外，QFT框架实现了内存高效调优，将模型状态内存减少至21%。研究还关注大型模型的细调内存开销，提出高效激活函数和Memory-Sharing Backpropagation策略，降低内存使用30%。

通过记忆化意识降低机器学习、视觉和语言模型训练流程中的超参数调优成本

BriefGPT - AI 论文速递 ·

Imbue公司成功训练了一个70B参数的语言模型，并分享了数据集创建、评估和基础设施设置的经验。他们开发了超参数优化器CARBS，帮助研究者在小规模实验中找到最佳超参数，以便扩展到大规模模型。通过大量实验，Imbue团队优化了模型性能，确保训练过程的稳定性。

70B大模型训练秘方③：1000次超参数优化实验的发现

OneFlow深度学习框架 ·

本研究提出了一种基于贝叶斯优化框架的自动化超参数优化方法，能够超越人类经验的调参表现。该方法适用于多种机器学习模型，包括深度学习和强化学习，具有快速收敛和良好的推广性。此外，研究还介绍了多保真贝叶斯优化和迁移学习的策略，以显著提高优化效率。

神经网络超参数调优的贝叶斯优化

BriefGPT - AI 论文速递 ·