小红花·文摘

超越真实数据：从正则化的视角看合成数据

Apple Machine Learning Research ·

代理可观察性推动代理评估

LangChain Blog ·

GAPO方法通过精准过滤噪声和稳健估计优势值，解决了企业在复杂环境中AI编程的rollout噪声问题，显著提升了模型的准确性和效率，使真实数据成为模型优化的关键。

鲁棒RL赋能AI编程！破局企业数据噪声难题，同等算力训出更好模型

量子位 ·

模型上下文协议（MCP）解读：常见问题解答

Vercel News ·

马蜂窝推出AI旅行助手“AI小蚂”，结合DeepSeek大模型与垂直精调模型，旨在消除旅行中的AI“幻觉”。该助手支持实时问答、行程规划和个性化推荐，用户可通过提问明确需求，生成个性化旅行方案。AI小蚂利用真实数据，缩短规划时间，确保信息准确，提升用户体验。

马蜂窝AI旅行助手官宣上线，DeepSeek大模型+垂直精调模型致力打破“幻觉”

量子位 ·

本研究提出了一种结合仿真与真实数据共同训练的策略，以解决机器人模型训练中真实数据不足的问题。实验结果表明，该方法在不同任务上显著提升了机器人在真实环境中的操作性能，平均提升达38%。

Sim-and-Real Co-Training: A Simple Method for Vision-Based Robotic Manipulation

BriefGPT - AI 论文速递 ·

使用AI创作内容？——智胜算法

DEV Community ·

可证明的不确定性分解通过高阶校准

Apple Machine Learning Research ·

通过在开发中使用暂存服务提升开发体验

DEV Community ·

清北团队进军具身智能，银河通用、灵初智能、星海图齐发力

机器之心 ·

本研究提出了一种名为Mono2Stereo的立体匹配增强方法，旨在缩小合成数据集与真实数据集之间的差距。通过两阶段训练，该方法显著提升了匹配性能，尤其在零-shot泛化和领域微调方面表现突出。

Mono2Stereo: An Enhanced Stereo Matching Method Based on Monocular Knowledge Transfer

BriefGPT - AI 论文速递 ·

本研究提出了一种系统的量化框架，解决了机器学习算法在因果推断中可推广性评估不足的问题，通过真实数据模拟评估模型性能，为实际应用提供指导。

Causality Inference Generalizability Testing

BriefGPT - AI 论文速递 ·

本研究提出了一种加权损失方法，以解决合成数据与真实数据的不匹配问题。通过强调高质量和多样化的LLM生成数据，显著提升了文本分类模型的性能，优于传统方法，为合成数据的有效利用提供了新思路。

并非所有LLM生成的数据都是平等的：重新思考文本分类中的数据加权

BriefGPT - AI 论文速递 ·

本文探讨了生成模型在混合真实与合成数据训练中的稳定性问题，提出了理论框架分析模型崩溃现象。研究表明，合成数据的增加可能导致模型性能下降，但在适当比例的真实数据支持下，可以有效缓解这一问题。实验验证强调了平衡真实与合成数据的重要性，以促进生成式人工智能的可持续发展。

崩溃还是繁荣？自我生成世界中合成数据的风险与机遇

BriefGPT - AI 论文速递 ·

本文研究了语言模型性能与交叉熵损失的关系，发现模型规模、数据集大小和计算量呈幂律关系。研究表明，混合使用真实数据与合成数据训练可以缓解模型崩溃现象，并提出自适应正则化策略以减轻影响。模型崩溃指在使用合成数据训练新模型时性能下降，因此需谨慎选择训练数据。

强模型崩溃

BriefGPT - AI 论文速递 ·

本文探讨了生成模型在自我消耗循环中的训练挑战，提出了模型自噬障碍（MAD）概念，并分析了合成数据与真实数据的关系。研究表明，合成数据能提升性能，但真实数据仍不可或缺。扩散模型在图像生成中表现优异，未来需平衡真实与合成数据的使用，以优化生成效果并解决伦理问题。

自我改善的扩散模型和合成数据

BriefGPT - AI 论文速递 ·

浏览器里能跑的SOTA小模型在2亿、5亿和20亿级别获胜。团队发现合成数据只在特定领域有用，真实数据潜力未完全发挥。团队开源了一个对标的大型合成数据集。使用经过严格过滤的网络数据后，性能直线上升。合成数据还是比不过真实数据。小模型也要在数万亿token上训练。最终发布的系列模型适合各种设备。对齐和微调技术对小模型效果不理想。

小模型站起来了，浏览器里跑出SOTA，抱抱脸：快逃，合成数据不是未来

量子位 ·

本文探讨了模型崩溃现象，指出仅使用合成数据训练新模型时性能下降，而混合真实与合成数据可以避免崩溃。研究开发了框架，通过实验验证合成数据生成的有效性，强调其在数据科学中的潜力。

超越模型崩溃：通过合成数据实现规模扩展需要加强

BriefGPT - AI 论文速递 ·

百度AI技术生态部与ProtoPie合作推出《如何提高AI产品原型表现力》系列沙龙课，帮助AI产品方向从业者和学习者提升设计能力和利用真实数据的技巧。

报名AI产品原型设计公开课！与ProtoPie一起打造高保真AI原型

百度大脑 ·

本文介绍了SyntheticP3D数据集和CC3D方法，结合使用可以在只有10%真实数据的情况下取得与最先进模型相媲美的物体位姿估计结果，并在使用50%真实数据时超越SOTA模型10.4%。

合成数据用于多物体抓握中的快速注释和鲁棒分割

BriefGPT - AI 论文速递 ·