小红花·文摘

机器学习在量化选股中的应用不仅仅是特征拼接和模型训练，成功的关键在于标签构造、特征处理、训练协议、模型解释和上线监控等细节。机器学习应嵌入具体环节，帮助合成信号，而非替代传统模型。有效的标签构造和特征工程是提升模型表现的基础，需避免未来信息泄漏和过拟合。模型上线后需持续监控其表现和稳定性，以应对市场变化。

【量化交易】机器学习选股：标签构造、防过拟合、SHAP 归因

土法炼钢兴趣小组的博客 ·

回测策略的有效性需逐层验证，包括语法、逻辑、数据和推断。应避免前视偏差、过拟合和数据窥视，确保策略在独立样本上有效。回测的目标是提高可信度，而非仅追求美观的结果。

【量化交易】回测陷阱：前视偏差、过拟合、数据窥视

土法炼钢兴趣小组的博客 ·

神经网络本质上是一个函数，通过输入输出结果来工作。训练过程是调整参数以使输出接近预期。深度学习利用多层结构和非线性激活函数来拟合复杂关系，能够有效处理高维数据。理解神经网络的关键在于明确输入、输出和参数的关系。

【Transformer 与注意力机制】04. 函数与神经网络：从 y=f(x) 到一台可学习的拟合机器

土法炼钢兴趣小组的博客 ·

避免过拟合、类别不平衡与特征缩放问题：机器学习从业者的笔记本

KDnuggets ·

人工智能模型 – 偏差、方差、欠拟合、过拟合

DEV Community ·

本研究提出了一种验证引导高斯数量控制（VGNC）方法，旨在解决稀疏视图3D重建中的过拟合问题。VGNC通过生成验证图像来优化高斯数量，显著降低过拟合，提高渲染质量，减少高斯点数量，从而降低存储需求并加快训练与渲染速度。

VGNC：通过验证引导的高斯数量控制减少稀疏视图3DGS的过拟合

BriefGPT - AI 论文速递 ·

使用Python诊断和修复机器学习中的过拟合

MachineLearningMastery.com ·

本研究提出一种两阶段框架，解决因错误标签导致的强模型过拟合问题，显著提升模型性能，某些模型改进达到100%。

如何缓解弱到强泛化中的过拟合问题？

BriefGPT - AI 论文速递 ·

AI语言模型在精细调优时出现奇怪的“超拟合”效应

DEV Community ·

赛博树突觉醒！AI 仿生革命：更少参数，更强性能，过拟合？不存在的！

机器之心 ·

本研究将生成对抗网络（GANs）与主动外观模型（AAM）结合，解决了计算机视觉中非线性参数优化的难题，显著提升了拟合的准确性和效率，尤其在高变异性和遮挡情况下表现优异。

利用GAN优化主动外观模型的模型拟合

BriefGPT - AI 论文速递 ·

将函数拟合到数据

DEV Community ·

本研究针对深度学习在拟合非线性薛定谔方程中的不足，通过采用特征解耦分布方法（FDD）来提高拟合能力。研究表明，应用该方法后，非线性薛定谔方程的损失显著降低，展示了其在深度学习拟合中的潜在影响。

利用线性特征解耦方法提高深度学习对非线性薛定谔方程的拟合精度

BriefGPT - AI 论文速递 ·

该研究解决了从点云中准确估计签名距离函数（SDF）的问题，尤其在高噪声点云的情况下。作者提出了一种新颖的统计推理算法，能够在没有签名距离监督、干净点云或点法线的情况下，对数据驱动的先验进行微调，从而实现更好的泛化能力和更快的收敛速度。该方法在表面重建和点云去噪中表现优于现有最先进的方法，具有重要的实际应用价值。

通过对单个噪声点云进行过拟合推断神经签名距离函数

BriefGPT - AI 论文速递 ·

本文探讨了基于transformers的上下文学习（ICL）及其在多任务学习中的应用，证明其能够隐式编码小模型并实现精确预测。研究表明，transformers能执行标准机器学习算法，如梯度下降，并在不同数据分布下表现出鲁棒性。此外，提出的优化算法优于传统方法，为上下文泛化提供了新视角。

训练的变换器分类器的泛化能力及其在上下文中的良性过拟合表现

BriefGPT - AI 论文速递 ·

本研究探讨了经典统计直觉在现代机器学习现象（如双重下降和良性过拟合）下的局限性，揭示了这种局限源于固定设计与随机设计之间的根本性差异。研究表明，从固定设计转向随机设计会对偏差-方差权衡的直觉产生深远影响，这一发现有助于理解现代机器学习的预测能力与统计直觉之间的显著差异。

经典统计（样本内）直觉的泛化效果差：关于偏差-方差权衡、过拟合及从固定设计向随机设计转变的说明

BriefGPT - AI 论文速递 ·

在 PyTorch 中的过拟合与欠拟合

DEV Community ·

本文比较了基于循环神经网络（RNN）和Transformer的语言模型在人类语言处理中的表现，发现Transformer在模拟阅读时间和神经活动方面优于RNN。研究表明，Transformer模型能够准确预测人类阅读行为，并隐式编码语言的重要性。此外，提出了ALiBi方法以提升模型性能，并探讨了惊奇度与阅读时间的关系，验证了跨语言的相关性。

训练中的线性最近偏差提升变换器与阅读时间的拟合度

BriefGPT - AI 论文速递 ·

本研究解决了在参数个数大于观测个数（p > n）的情况下，线性模型估计中出现的不可识别参数问题。通过引入双重下降现象和相关的预测机制，提出了一种新颖的过拟合模型，显著提升了对新观察数据的预测能力。研究结果表明，采用适当的估计方法能够有效减小过拟合的影响，从而改善模型的泛化能力。

双重下降：理解不可识别参数的线性模型估计及过拟合模型

BriefGPT - AI 论文速递 ·

本研究将能量距离、距离协方差与最大均值差（MMD）联系起来，探讨其在概率分布下的可靠性及多参数数据的适用性。提出了B-tests，结合了MMD检验的优点，具有更强的计算效率和渐近正常分布特性。此外，研究介绍了新的无偏采样方法、适应性拟合优度检验和特征Stein差异度量，展示了在高维数据和模型结构下的优越性能。

核拟合优度检验的鲁棒性

BriefGPT - AI 论文速递 ·