小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
提升时间序列模型性能的五种交叉验证方法

本文介绍了五种交叉验证方法,以提升时间序列模型的性能。这些方法包括前向验证以模拟真实部署、比较扩展和滑动窗口以测试记忆深度、检测时间数据泄漏、评估模型在不同状态下的稳健性,以及基于稳定性调整超参数。这些策略有助于提高模型在实际应用中的可靠性,避免过拟合和数据泄漏。

提升时间序列模型性能的五种交叉验证方法

MachineLearningMastery.com
MachineLearningMastery.com · 2026-01-28T11:00:59Z
Hugging Face 开源 FineVision:一个包含 2400 万个样本的全新多模态数据集,用于训练视觉语言模型

Hugging Face 发布了 FineVision,一个包含 1730 万张图片和近 100 亿个答案标记的开放多模态数据集。该数据集经过严格筛选和系统评级,提升了视觉语言模型的训练质量,支持多种新兴任务,减少数据泄漏,推动研究的可重复性和可访问性。

Hugging Face 开源 FineVision:一个包含 2400 万个样本的全新多模态数据集,用于训练视觉语言模型

实时互动网
实时互动网 · 2025-09-08T02:10:58Z
如何诊断回归模型失败的原因

本文探讨了回归模型失败的常见原因及其诊断方法,包括欠拟合、过拟合、数据泄漏、噪声特征、数据预处理不当、超参数设置错误和数据量不足。通过XGBoost模型实例,展示了识别和解决这些问题的方法,以提高预测准确性。

如何诊断回归模型失败的原因

MachineLearningMastery.com
MachineLearningMastery.com · 2025-07-31T16:27:21Z
日志关联性

日志关联性是将同一事务或用户会话的日志条目连接的实践。使用关联ID可以追踪用户在分布式系统中的操作路径。Log4j支持MDC,便于在多线程应用中记录上下文信息,需在使用后清除以防数据泄漏。

日志关联性

DEV Community
DEV Community · 2025-05-22T13:34:07Z

本文研究了大语言模型(LLMs)在关键行业中的安全性,特别是恶意查询导致的数据泄漏风险。通过建立基准数据集,比较了13种安全工具的有效性,发现Lakera Guard和ProtectAI LLM Guard表现最佳,并提出了改进建议。

评估大语言模型安全解决方案的有效性:Palit基准数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z
我在AI研究中发现的不安真相

作者在情感分类研究中发现,许多AI论文声称方法“无关个体”,但评估技术导致数据泄漏,夸大模型性能。这种误导可能影响开发者的实际应用,损害AI研究的可信度。作者呼吁关注评估方法,倡导诚实报告和严格验证,以确保AI研究的真实进展。

我在AI研究中发现的不安真相

DEV Community
DEV Community · 2025-04-05T22:55:47Z

本研究提出了“幻影维基”,旨在解决大型语言模型在推理和检索评估中的数据泄漏问题,生成独特且一致的文档语料库,并提供可扩展的评估框架。

幻影维基:按需生成的推理与检索评估数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-27T00:00:00Z

本研究分析了成员推断攻击(MIA)在大语言模型中的局限性,指出合成数据可能导致错误的模型记忆和数据泄漏,强调评估时需谨慎。

Synthetic Data May Mislead Evaluations: Membership Inference as Machine Text Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-20T00:00:00Z
💧 📉 💧 你是否在浪费金钱和时间:你的数据是否存在泄漏? 💧 📉 💧

机器学习模型的泛化能力尚不明确,测试集数据泄漏会导致评估错误。新开源功能Leaky-Splits可自动检测和清理数据泄漏,从而提高模型的可信度和评估准确性。

💧 📉 💧 你是否在浪费金钱和时间:你的数据是否存在泄漏? 💧 📉 💧

DEV Community
DEV Community · 2024-12-12T17:24:41Z

数据完整性确保数据在生命周期内的准确性、一致性和完整性,防止数据丢失和泄漏,支持准确决策和合规性。

数据完整性为何重要?

DEV Community
DEV Community · 2024-10-18T14:08:03Z

苹果提议将网站安全证书有效期缩短至45天,引发争议。美国陆军成立TIAD应对全球信息威胁。芬兰关闭暗网市场“Sipulitie”。思科数据疑似泄漏,大众汽车遭勒索软件攻击。SolarWinds、Kubernetes等曝出漏洞,FIDO联盟简化密钥传输协议。Apache CloudStack修补漏洞。文章还讨论信息安全规划和Java反序列化技术。

FreeBuf早报 | 苹果缩短网站安全证书有效期提案遭反对;思科机密开发数据疑遭模泄漏

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2024-10-17T03:08:07Z

研究发现,许多视觉内容是多余的,答案可以从问题和选项或LLM的知识中推断。此外,LLM和LVLM训练中存在数据泄漏。为此,提出了MMStar多模态基准,具备6个核心能力和18个方向。研究在MMStar上评估了16个LVLM,分析其多模态能力及数据泄漏问题。

视觉语言模型中的阿谀奉承现象:信心是否丧失?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-15T00:00:00Z

研究表明,许多视觉内容是多余的,答案可以通过问题、选项或LLM的知识推断得出。此外,LLM和LVLM训练中存在数据泄漏问题。为此,提出了MMStar多模态基准,具备6个核心能力和18个方向。研究在MMStar上评估了16个LVLM,分析其多模态能力及数据泄漏问题。

通过模态集成率解码大型视觉语言模型中的跨模态对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-09T00:00:00Z

研究表明,许多视觉内容是多余的,答案可以从问题和选项或LLM的知识中推断。LLM和LVLM训练中存在数据泄漏问题。为此,提出了MMStar基准,涵盖6个核心能力和18个方向,并在此基准上评估了16个LVLM,分析其多模态能力及数据泄漏和实际增益。

MVP-Bench:大型视觉-语言模型能否像人类一样进行多层次视觉感知?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z

通过研究评估作品,发现两个问题:1)视觉内容对于很多样本来说是不必要的;答案可以从问题和选项中推断出来,或者来自于世界知识。2)在训练中存在数据泄漏。为解决这些问题,提出了MMStar,一个具有6个核心能力和18个详细方向的多模态基准。在MMStar上评估了16个主要的LVLM,并调查了它们的数据泄漏和实际多模态增益。

NVLM:开放前沿级多模态大语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z
为了最赚钱的GTAOL,R星制造了多少牺牲品?

2022年9月,黑客窃取了R星内部文件,包括GTA6的视频片段和GTA5的开发源代码。数据泄漏导致GTA6开发延迟,但核心粉丝可以挖掘GTA5开发背后的故事。然而,R星放弃了线下DLC开发,专注于GTA Online更新,引起玩家失望和对GTA6质量的担忧。

为了最赚钱的GTAOL,R星制造了多少牺牲品?

游戏研究社
游戏研究社 · 2024-07-13T03:30:00Z

通过研究评估作品,发现两个问题:1)视觉内容对于很多样本来说是不必要的;答案可以从问题和选项中推断出来,或者来自于LLM中的世界知识。2)在LLM和LVLM训练中存在数据泄漏。为解决这些问题,提出了MMStar,一个由人工精选的多模态基准。在MMStar上评估了16个LVLM,调查了它们的多模态能力、数据泄漏和实际多模态增益。

Cambrian-1:全面开放、以视觉为中心的多模态 LLMs 研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

通过研究评估作品,发现两个问题:1)视觉内容对于很多样本来说是不必要的;答案可以从问题和选项中推断出来,或者来自于LLM中的世界知识。2)在LLM和LVLM训练中存在数据泄漏。为解决这些问题,提出了MMStar,一个具有6个核心能力和18个详细方向的多模态基准。在MMStar上评估了16个主要的LVLM,并调查了它们的数据泄漏和实际多模态增益。

INS-MMBench: 保险领域 LVLMs 性能综合评估的全面基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-13T00:00:00Z

报道了一起数据泄漏事件,缺乏具体细节和相关信息。

举报五月天“假唱”的博主个人隐私遭泄露

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2023-12-14T02:31:13Z

2023年全球数据泄漏达3.6亿人,增长20%。德国用户遭MrAnon stealer恶意软件攻击。某OA系统开发商罚款10万元。云工程师因删除代码被判两年监禁。阿联酋电视台因网络攻击播放以巴冲突视频。超过1450台pfSense服务器存在安全风险。微软修补909个漏洞。乌克兰军事情报入侵俄罗斯税务局。粤港澳大湾区个人信息跨境流动标准合同实施指引公布。Struts 2开源Web应用程序存在严重安全漏洞。中央网信办整治短视频信息内容不良问题。乌克兰最大移动运营商遭网络攻击瘫痪。加密代币钱包安全性分析。SideCopy利用WinRAR漏洞攻击。2024年网络安全趋势预测。

FreeBuf早报 | 2023年微软共修补了909个漏洞;23年3.6亿人泄漏数据创历史新高

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2023-12-13T08:53:36Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码