小红花·文摘

在金融时间序列分析中，传统的K折交叉验证可能导致数据泄漏，影响模型在实盘中的表现。由于金融数据的序列依赖性和市场结构变化，需采用Walk-Forward和Purged K-Fold等方法进行时间序列切分。本文探讨了交叉验证的误区、标签泄漏的类型及修复方法，并提供了Python实现框架，强调风险提示与适用范围。

【量化交易】Walk-forward 与 Purged CV：时间序列正确切分

土法炼钢兴趣小组的博客 ·

Hugging Face 开源 FineVision：一个包含 2400 万个样本的全新多模态数据集，用于训练视觉语言模型

实时互动网 ·

日志关联性

DEV Community ·

本文研究了大语言模型（LLMs）在关键行业中的安全性，特别是恶意查询导致的数据泄漏风险。通过建立基准数据集，比较了13种安全工具的有效性，发现Lakera Guard和ProtectAI LLM Guard表现最佳，并提出了改进建议。

我在AI研究中发现的不安真相

DEV Community ·

本研究提出了“幻影维基”，旨在解决大型语言模型在推理和检索评估中的数据泄漏问题，生成独特且一致的文档语料库，并提供可扩展的评估框架。

幻影维基：按需生成的推理与检索评估数据集

BriefGPT - AI 论文速递 ·

本研究分析了成员推断攻击（MIA）在大语言模型中的局限性，指出合成数据可能导致错误的模型记忆和数据泄漏，强调评估时需谨慎。

Synthetic Data May Mislead Evaluations: Membership Inference as Machine Text Detection

BriefGPT - AI 论文速递 ·

💧 📉 💧 你是否在浪费金钱和时间：你的数据是否存在泄漏？ 💧 📉 💧

DEV Community ·

数据完整性确保数据在生命周期内的准确性、一致性和完整性，防止数据丢失和泄漏，支持准确决策和合规性。

数据完整性为何重要？

DEV Community ·

苹果提议将网站安全证书有效期缩短至45天，引发争议。美国陆军成立TIAD应对全球信息威胁。芬兰关闭暗网市场“Sipulitie”。思科数据疑似泄漏，大众汽车遭勒索软件攻击。SolarWinds、Kubernetes等曝出漏洞，FIDO联盟简化密钥传输协议。Apache CloudStack修补漏洞。文章还讨论信息安全规划和Java反序列化技术。

FreeBuf早报 | 苹果缩短网站安全证书有效期提案遭反对；思科机密开发数据疑遭模泄漏

FreeBuf网络安全行业门户 ·

本研究探讨了大型语言模型（LLM）评估中的数据泄漏和偏见问题，提出了新基准和评估框架，如OR-Bench和LiveBench，以提高评估的可靠性和效率。研究强调模型诚实性的重要性，并通过自动检测方法识别模型弱点，推动LLM性能提升。

自动化语言模型基准测试的作弊问题：无效模型取得高胜率

BriefGPT - AI 论文速递 ·

本文介绍了多个多模态基准测试的开发，包括MM-Vet、MMBench和AlignMMBench，旨在评估大型视觉语言模型（VLMs）在复杂任务中的表现。研究强调了人类偏好的重要性，并推出了WildVision-Arena平台以收集反馈。此外，提出了MMStar和MLLM-Bench，以解决数据泄漏和主观性评估的问题，推动多模态智能的发展。

MM-Vet v2：用于评估大型多模态模型综合能力的一个具有挑战性的基准测试

BriefGPT - AI 论文速递 ·

为了最赚钱的GTAOL，R星制造了多少牺牲品？

游戏研究社 ·

这篇文章探讨了大型语言模型（LLMs）的记忆行为及其对隐私的影响。研究发现，模型在训练过程中可能记忆个人可识别信息（PII），并在推理中泄露。为减轻隐私风险，建议采用记忆减轻技术，并强调在模型训练中需谨慎处理数据以保护隐私。

揭开潜在记忆：评估大型语言模型中的数据泄露和记忆模式

BriefGPT - AI 论文速递 ·

大型语言模型存在数据泄漏风险，可能导致个人信息泄露和版权侵犯。研究表明，即使少量泄漏数据也会引发大量信息泄露。提出的自检测方法优于现有方法，强调评估基准的可靠性问题，并建议开发者和基准维护者采取更强的评估措施。

大型语言模型中基准测试的基准泄露

BriefGPT - AI 论文速递 ·

本研究构建了PPIRef数据集，并使用PPIformer模型提升蛋白质-蛋白质相互作用的突变预测，展示了其在药物研究中的潜力。同时，探讨了数据泄漏对机器学习模型性能的影响，并提出了改进方法以确保模型的可靠性。

揭示蛋白质相互作用基准中的数据泄漏

BriefGPT - AI 论文速递 ·

报道了一起数据泄漏事件，缺乏具体细节和相关信息。

2023年全球数据泄漏达3.6亿人，增长20%。德国用户遭MrAnon stealer恶意软件攻击。某OA系统开发商罚款10万元。云工程师因删除代码被判两年监禁。阿联酋电视台因网络攻击播放以巴冲突视频。超过1450台pfSense服务器存在安全风险。微软修补909个漏洞。乌克兰军事情报入侵俄罗斯税务局。粤港澳大湾区个人信息跨境流动标准合同实施指引公布。Struts 2开源Web应用程序存在严重安全漏洞。中央网信办整治短视频信息内容不良问题。乌克兰最大移动运营商遭网络攻击瘫痪。加密代币钱包安全性分析。SideCopy利用WinRAR漏洞攻击。2024年网络安全趋势预测。

FreeBuf早报 | 2023年微软共修补了909个漏洞；23年3.6亿人泄漏数据创历史新高

FreeBuf网络安全行业门户 ·

【量化交易】Walk-forward 与 Purged CV：时间序列正确切分

提升时间序列模型性能的五种交叉验证方法

Hugging Face 开源 FineVision：一个包含 2400 万个样本的全新多模态数据集，用于训练视觉语言模型

如何诊断回归模型失败的原因

日志关联性

评估大语言模型安全解决方案的有效性：Palit基准数据集

我在AI研究中发现的不安真相

幻影维基：按需生成的推理与检索评估数据集

Synthetic Data May Mislead Evaluations: Membership Inference as Machine Text Detection

💧 📉 💧 你是否在浪费金钱和时间：你的数据是否存在泄漏？ 💧 📉 💧

数据完整性为何重要？

FreeBuf早报 | 苹果缩短网站安全证书有效期提案遭反对；思科机密开发数据疑遭模泄漏

自动化语言模型基准测试的作弊问题：无效模型取得高胜率

MM-Vet v2：用于评估大型多模态模型综合能力的一个具有挑战性的基准测试

为了最赚钱的GTAOL，R星制造了多少牺牲品？

揭开潜在记忆：评估大型语言模型中的数据泄露和记忆模式

大型语言模型中基准测试的基准泄露

揭示蛋白质相互作用基准中的数据泄漏

举报五月天“假唱”的博主个人隐私遭泄露

FreeBuf早报 | 2023年微软共修补了909个漏洞；23年3.6亿人泄漏数据创历史新高