小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
更好的工具:利用评估数据进行工具优化的方案

通过使用评估数据(evals),我们可以迭代改进智能代理的性能。评估数据作为训练数据,指导代理学习和优化行为。强调数据质量和设计的重要性,以避免过拟合,并通过手动编写、生产追踪和外部数据集获取评估,确保代理在新输入上的泛化能力。

更好的工具:利用评估数据进行工具优化的方案

LangChain Blog
LangChain Blog · 2026-04-08T19:30:20Z
CS231n 讲义 V:卷积神经网络基础

卷积神经网络(CNN)通过提取图像特征,解决了传统神经网络在处理大图像时的过拟合和忽视空间结构的问题。CNN由卷积层、池化层和全连接层组成,逐步将原始像素转换为分类分数。卷积层使用可学习的滤波器进行线性操作,池化层通过下采样降低特征图的空间分辨率,同时保持特征的平移不变性。

CS231n 讲义 V:卷积神经网络基础

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-02T14:45:09Z
7个提升预测模型准确性的XGBoost技巧

本文介绍了7个优化XGBoost库的Python技巧,以提升预测模型的准确性,包括调整学习率和树的数量、限制树深度、通过子采样减少过拟合、添加正则化、使用早停法、进行超参数搜索和处理类别不平衡。这些方法能显著提高模型性能。

7个提升预测模型准确性的XGBoost技巧

KDnuggets
KDnuggets · 2026-02-20T13:00:37Z
CS231n 讲义 II:线性分类器

KNN算法存在不足,需要更强的替代方法。新方法引入评分函数和损失函数,评分函数将图像像素映射为类别分数,损失函数则量化预测分数与真实标签的差异。通过正则化优化权重,以提升分类器的泛化能力,防止过拟合。

CS231n 讲义 II:线性分类器

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-02-11T00:45:09Z
参数到底是什么?!

机器学习模型的参数决定其行为和性能,影响预测结果。训练数据质量直接影响参数学习,参数过多或过少可能导致过拟合或欠拟合。理解参数对掌握机器学习至关重要。

参数到底是什么?!

KDnuggets
KDnuggets · 2026-02-02T15:00:39Z
机器学习数据增强完全指南

数据增强通过微调现有数据生成新训练样本,帮助模型减少过拟合并提升泛化能力。文章讨论了图像、文本、音频和表格数据的增强方法,强调在线与离线增强的区别及避免数据泄露的重要性。

机器学习数据增强完全指南

MachineLearningMastery.com
MachineLearningMastery.com · 2026-01-16T11:00:51Z
避免过拟合、类别不平衡与特征缩放问题:机器学习从业者的笔记本

机器学习面临过拟合、类别不平衡和特征缩放等挑战。过拟合可通过交叉验证检测,增加训练数据可改善模型表现。类别不平衡可通过调整类权重和重采样策略解决。特征缩放确保输入特征对模型训练的贡献均衡。理解这些问题及其解决方案是提升模型性能的关键。

避免过拟合、类别不平衡与特征缩放问题:机器学习从业者的笔记本

KDnuggets
KDnuggets · 2026-01-14T14:56:26Z
小猫都能懂的大模型原理 1 - 深度学习基础

本文介绍了大语言模型的基本原理,强调其在人工智能、机器学习和深度学习中的重要性。深度学习通过多层神经网络自动提取数据特征,利用激活函数和反向传播优化权重。需平衡模型复杂性和层数,以防过拟合和梯度消失问题。

小猫都能懂的大模型原理 1 - 深度学习基础

UsubeniFantasy
UsubeniFantasy · 2025-11-30T15:01:45Z
决策树为何会失败(以及如何修复它们)

决策树在实际应用中可能面临过拟合、欠拟合和特征冗余等问题。过拟合使模型过于复杂,导致新数据预测不佳;欠拟合则因模型过于简单,无法有效学习。为优化决策树模型,可以采用正则化、调整模型复杂度和特征选择等方法。

决策树为何会失败(以及如何修复它们)

MachineLearningMastery.com
MachineLearningMastery.com · 2025-11-19T11:00:12Z

认知科学家收集了包含数百万个“奇异物体”判断的THINGS数据集,但仅使用几千张图像进行微调,导致模型过拟合并遗忘先前技能。

教人工智能更像我们一样看待世界

Google DeepMind Blog
Google DeepMind Blog · 2025-11-11T11:49:13Z
什么是交叉验证?通俗易懂的图解指南

交叉验证是一种评估机器学习模型性能的方法,通过多个数据子集来避免单一训练/测试分割的偏差。它能更可靠地估计模型表现,降低过拟合风险,尤其适用于小数据集。常见的交叉验证方法有k折交叉验证、分层k折、留一交叉验证和时间序列交叉验证。使用交叉验证可以获得更稳定的性能估计,帮助理解模型在实际应用中的表现。

什么是交叉验证?通俗易懂的图解指南

KDnuggets
KDnuggets · 2025-10-01T16:00:32Z

华人团队研究表明,扩散语言模型在token数量受限时,其数据潜力超过自回归模型三倍,且未出现性能饱和。该模型通过双向建模和高计算密度提升学习效果,且在过拟合情况下性能仍可能持续提升。

华人团队终结Token危机:扩散模型数据潜力超自回归三倍

量子位
量子位 · 2025-08-13T09:19:44Z
如何诊断回归模型失败的原因

本文探讨了回归模型失败的常见原因及其诊断方法,包括欠拟合、过拟合、数据泄漏、噪声特征、数据预处理不当、超参数设置错误和数据量不足。通过XGBoost模型实例,展示了识别和解决这些问题的方法,以提高预测准确性。

如何诊断回归模型失败的原因

MachineLearningMastery.com
MachineLearningMastery.com · 2025-07-31T16:27:21Z
讨论决策树:什么是好的分裂?

决策树是一种有效的预测模型,广泛应用于金融欺诈检测和客户流失预测。构建决策树时,关键在于通过数据驱动的方式进行节点分裂,以实现类的同质性。分裂条件通过算法(如CART)确定,旨在最大化类的同质性并减少节点的不纯度。过度生长可能导致模型过拟合,因此需谨慎应用。

讨论决策树:什么是好的分裂?

MachineLearningMastery.com
MachineLearningMastery.com · 2025-07-15T12:00:57Z
大规模无监督微调大型语言模型的规律

本文探讨了在目标领域微调语言模型时面临的挑战,如有限数据导致的过拟合和遗忘预训练分布。研究表明,混合1%的预训练数据可以有效防止遗忘并减轻过拟合现象。

大规模无监督微调大型语言模型的规律

Apple Machine Learning Research
Apple Machine Learning Research · 2025-06-20T00:00:00Z

文章讨论了人工智能(AI)学习的复杂性,特别是过拟合问题。AI通过识别模式和模仿人类行为进行学习,但训练过程中可能因数据不均衡导致错误判断。过拟合使模型只关注特定数据特征,无法适应新数据。确保训练数据的多样性和准确性是避免模型学习错误信息的关键。

【程序员搞笑图片】当AI大模型看到没有训练过的数据

程序师
程序师 · 2025-06-17T03:23:58Z
卷积神经网络设计指南:从理论到实践的经验总结

本文讨论了卷积神经网络(CNN)的设计,包括特征提取器和分类器的结构。特征提取器由卷积层和池化层构成,分类器通过全连接层进行预测。使用奇数尺寸的卷积核有助于保持对齐并简化填充。随着网络深度增加,性能提升逐渐减缓,现代设计倾向于使用全局平均池化以降低过拟合风险。整体设计仍依赖经验和直觉,缺乏坚实的理论基础。

卷积神经网络设计指南:从理论到实践的经验总结

Seraphineの小窝
Seraphineの小窝 · 2025-06-09T09:13:40Z

该研究提出了一种挤压与重校准(SR)模块,旨在改善计算病理学中少量样本学习模型的过拟合和特征错误表征,从而显著提升模型性能,具有广泛的应用潜力。

Beyond Linearity: Squeeze and Recalibration Module for Few-Shot Whole Slide Image Classification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究提出了Baguan模型,通过战略预训练减少天气预测中的过拟合问题。该模型基于自我监督的Siamese自编码器,实验结果表明其在中期天气预测中优于传统方法。

Utilizing Strategic Pre-training to Reduce Overfitting: Baguan - A Pre-trained Weather Forecasting Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出了一种逐步自适应混合训练框架SASR,旨在解决大型语言模型训练中的过拟合和模式崩溃问题。SASR通过动态调整监督微调与强化学习的比例,提升模型性能。

逐步自适应集成监督微调和强化学习用于任务特定的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码