小红花·文摘

时序深度学习在量化金融中的应用面临挑战，包括标签和窗口口径错误、训练与推理统计分布不对齐、模型对随机种子的敏感性等。文章探讨了在量化场景中有效使用时序深度学习的方法，强调TCN和Transformer的适配问题，以及通过集成方法降低过拟合风险。工程实践中需关注模型的训练、推理延迟和监控指标，以确保模型的稳定性和有效性。

【量化交易】时间序列深度学习：TCN、Transformer 在量化的实践与陷阱

土法炼钢兴趣小组的博客 ·

大语言模型微调实用指南

Databricks ·

本研究提出了一种新的“噪声早停”方法，解决了在存在噪声标签的数据集上训练神经网络分类器时过拟合风险增加的问题。该方法通过监测噪声数据集上的准确性来实现早停，降低了早停实现的成本，并在标准基准测试中证明了其强大的性能。

噪声标签下的噪声早停

BriefGPT - AI 论文速递 ·

本文介绍了Ascend C自定义PRelu算子的开发过程，PRelu是Relu的改进版本，可以提升模型的拟合能力和减小过拟合风险。文章详细介绍了安装开发者套件、生成算子工程代码、修改配置项、编译算子工程、验证算子正确性的步骤。

Ascend C 自定义PRelu算子

华为云官方博客 ·

该论文研究了跨领域少样本分割问题，并提出了一种新型的跨领域fine-tuning策略，通过设计双向少样本预测和迭代少样本适配器来降低过拟合风险并最大化利用稀疏的新颖类别样本的监督信号。实验证明该方法优于当前技术水平，能同时应对跨领域挑战和减轻过拟合问题。

跨领域少样本分割通过迭代支持查询对应挖掘

BriefGPT - AI 论文速递 ·

该文介绍了一种可解释的深度学习模型，通过正则化方法提高网络的稳健泛化能力。研究表明，正则化方法可以强制网络忽略损坏数据，在未损坏数据集上达到 100% 的准确性。此外，该模型还可以通过逐渐抹除记忆表示来降低过拟合风险。

超越神经网络的理解：模型复杂性的实证探索

BriefGPT - AI 论文速递 ·