小红花·文摘

GAPO方法通过精准过滤噪声和稳健估计优势值，解决了企业在复杂环境中AI编程的rollout噪声问题，显著提升了模型的准确性和效率，使真实数据成为模型优化的关键。

鲁棒RL赋能AI编程！破局企业数据噪声难题，同等算力训出更好模型

量子位 ·

测试时重用预训练数据是计算增益的倍增器

Apple Machine Learning Research ·

MoE-PHDS：一个用于灵活运行时稀疏性的MoE检查点

Apple Machine Learning Research ·

Intel的AutoRound算法已集成至LLM Compressor，支持低位宽量化，提升模型准确性并简化工作流程。该算法优化了多种数据类型的量化，旨在加速推理，未来将扩展支持更多格式和模型，以促进实际部署。

推动LLM的低位宽量化：AutoRound与LLM Compressor的结合

vLLM Blog ·

我们使用了三种特征选择技术：这一种效果最佳

KDnuggets ·

最优语料感知训练用于神经机器翻译

Apple Machine Learning Research ·

奥特曼首次展示GPT-5的实测，采用超级对齐团队的技术。GPT-5结合文本能力与推理，能够解决真实工程问题。引入通用验证器进行强化学习，以提高模型的准确性和可读性。尽管研发面临挑战，GPT-5仍在持续推进。

奥特曼首晒GPT-5实测！被曝使用超级对齐团队“遗产”

量子位 ·

香港大学、字节跳动Seed和复旦大学联合推出的Polaris方法，通过700步强化学习训练，使4B模型在数学推理能力上超越多款商业大模型，特别是在长文本生成方面表现突出。该方法强调动态调整训练数据和超参数，提升了模型的多样性和准确性。

4B小模型数学推理首超Claude 4，700步RL训练逼近235B性能 | 港大&字节Seed&复旦

量子位 ·

本研究探讨大型语言模型（LLM）的逻辑推理能力，提出了一种新的数据增强方法以训练传统逻辑证明。结果表明，LLM在短证明中表现良好，但在复杂证明时能力下降。模板转化显著提高了模型的准确性，适用于不同规模的模型。

大语言模型能否学习形式逻辑？一种数据驱动的训练与评估框架

BriefGPT - AI 论文速递 ·

本研究提出了一种新的协作分布式联邦学习方案，通过将模型分为三部分，实现客户端和服务器的并行训练与聚合，显著降低了计算和通信负担，提高了模型准确性。实验结果表明，该方案优于现有方法。

Collaborative Distributed Federated Learning with Parallel Training and Aggregation

BriefGPT - AI 论文速递 ·

文本数据清理对分析和机器学习项目至关重要，尤其在自然语言处理领域。常见问题包括拼写错误、特殊字符和多余空格。使用Python工具（如Pandas和NLTK）可以自动化清理过程，提升数据质量。关键步骤包括去除噪声、文本规范化、处理缩写、删除重复数据和多余空格。清理后的数据更易于分析，能提高模型的准确性。

如何在5个步骤中使用Python完全自动化文本数据清理

KDnuggets ·

本研究探讨了机器学习预测中评估预测结果与实际动态行为一致性的问题。引入动态指数后，发现标准误差与系统动态特性显著相关，尤其在长期预测中出现动态失真，为提高模型的准确性和可靠性提供了重要信息。

机器学习预测中的动态误差

BriefGPT - AI 论文速递 ·

该研究提出了一种新的持续全细调方案，解决大型语言模型的灾难性遗忘问题。通过自适应奇异值分解，动态识别低秩参数子空间，减少干扰，显著提升模型的准确性和语言能力保留。

塑造子空间：大型语言模型的约束全细调以实现持续学习

BriefGPT - AI 论文速递 ·

本研究提出了一种基于公式的监督学习框架（FDSL），旨在解决环境声音分析模型预训练中高质量标记数据不足的问题。通过使用合成数据集Formula-SED进行预训练，显著提升了模型的准确性和训练速度。

公式监督声音事件检测：无真实数据的预训练

BriefGPT - AI 论文速递 ·

本研究探讨了语义保持转换在缺陷检测中的有效性。尽管有93种可重用的转换，最终选用的转换未能提高模型的准确性，显示出实际应用中的挑战和可能导致的语义错误。

Semantic-Preserving Transformations as Mutation Operators: A Study on Their Effectiveness in Defect Detection

BriefGPT - AI 论文速递 ·

本研究提出了一种不确定性感知的政策优化框架，旨在解决模型基强化学习中的策略学习偏差问题。通过主动收集不确定样本以提高模型准确性，实验结果表明该方法在机器人操作和Atari游戏中优于现有技术。

Revisiting Exploration: Uncertainty-Aware Reinforcement Learning with Forward Planning

BriefGPT - AI 论文速递 ·

本研究提出了一种分布式分层联邦学习框架，旨在解决未来6G通信系统中非地面网络的效率和隐私问题。该框架通过高空平台整合低轨道卫星与地面客户端的训练，显著提升模型准确性并降低延迟。

非地面网络中的联邦学习：设计、架构与挑战

BriefGPT - AI 论文速递 ·

本研究探讨了视觉-语言模型中的幻觉问题，提出了一种跨时间预测连接（TPC）方法，通过增强logits的语义一致性，显著减少幻觉现象，提高模型的准确性和效率。

Cross-Temporal Prediction Connection: Reducing Hallucinations in Vision-Language Models

BriefGPT - AI 论文速递 ·

本研究提出了Mixtera数据平面，解决了训练数据集增长带来的样本管理问题。用户可以声明性地指定样本的使用比例和顺序，Mixtera在不影响训练效率的情况下，支持数据混合策略，显著提升模型训练准确性。

Mixtera: A Data Plane for Foundation Model Training

BriefGPT - AI 论文速递 ·

生成AI模式：微调

Martin Fowler ·