小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

GAPO方法通过精准过滤噪声和稳健估计优势值,解决了企业在复杂环境中AI编程的rollout噪声问题,显著提升了模型的准确性和效率,使真实数据成为模型优化的关键。

鲁棒RL赋能AI编程!破局企业数据噪声难题,同等算力训出更好模型

量子位
量子位 · 2026-02-16T11:30:47Z
测试时重用预训练数据是计算增益的倍增器

本文探讨了重用预训练数据在测试中的有效性。研究表明,通过检索增强生成和测试时计算,模型在MMLU、Math-500和SimpleQA等任务上的准确性显著提高。在MMLU上,预训练结合检索的方式实现了约5倍的计算增益,进一步的测试时计算可提升10个百分点。这表明当前预训练方法未充分利用现有数据集的信息,仍有改进空间。

测试时重用预训练数据是计算增益的倍增器

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-12T00:00:00Z
MoE-PHDS:一个用于灵活运行时稀疏性的MoE检查点

本文介绍了MoE-PHDS(后hoc声明稀疏性),一种轻量级的SFT方法,允许在推理时灵活调整稀疏性,而无需更换模型或架构。PHDS通过在不同稀疏水平上训练,提高了模型的准确性和延迟可预测性,简化了MoE的部署,并提升了跨稀疏性的一致性。实验结果显示,PHDS在多个操作点上优于传统模型。

MoE-PHDS:一个用于灵活运行时稀疏性的MoE检查点

Apple Machine Learning Research
Apple Machine Learning Research · 2025-12-11T00:00:00Z

Intel的AutoRound算法已集成至LLM Compressor,支持低位宽量化,提升模型准确性并简化工作流程。该算法优化了多种数据类型的量化,旨在加速推理,未来将扩展支持更多格式和模型,以促进实际部署。

推动LLM的低位宽量化:AutoRound与LLM Compressor的结合

vLLM Blog
vLLM Blog · 2025-12-09T00:00:00Z
我们使用了三种特征选择技术:这一种效果最佳

特征选择在机器学习中至关重要,能够减少噪声、避免过拟合并提高模型准确性。本文测试了过滤法、包裹法和嵌入法三种特征选择方法,结果表明Lasso回归在准确性、效率和可解释性方面表现最佳,适合高维数据集。

我们使用了三种特征选择技术:这一种效果最佳

KDnuggets
KDnuggets · 2025-10-02T12:02:53Z
最优语料感知训练用于神经机器翻译

本文介绍了最优语料感知训练(OCAT),该方法通过微调预训练模型提升模型准确性。在翻译任务中,OCAT相较于传统训练提高了3.6和1.8的chrF分数,且具有轻量、不易过拟合和强适应性等优点。

最优语料感知训练用于神经机器翻译

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-15T00:00:00Z

奥特曼首次展示GPT-5的实测,采用超级对齐团队的技术。GPT-5结合文本能力与推理,能够解决真实工程问题。引入通用验证器进行强化学习,以提高模型的准确性和可读性。尽管研发面临挑战,GPT-5仍在持续推进。

奥特曼首晒GPT-5实测!被曝使用超级对齐团队“遗产”

量子位
量子位 · 2025-08-04T03:27:24Z

香港大学、字节跳动Seed和复旦大学联合推出的Polaris方法,通过700步强化学习训练,使4B模型在数学推理能力上超越多款商业大模型,特别是在长文本生成方面表现突出。该方法强调动态调整训练数据和超参数,提升了模型的多样性和准确性。

4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦

量子位
量子位 · 2025-07-09T06:58:32Z

本研究探讨大型语言模型(LLM)的逻辑推理能力,提出了一种新的数据增强方法以训练传统逻辑证明。结果表明,LLM在短证明中表现良好,但在复杂证明时能力下降。模板转化显著提高了模型的准确性,适用于不同规模的模型。

大语言模型能否学习形式逻辑?一种数据驱动的训练与评估框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-28T00:00:00Z

本研究提出了一种新的协作分布式联邦学习方案,通过将模型分为三部分,实现客户端和服务器的并行训练与聚合,显著降低了计算和通信负担,提高了模型准确性。实验结果表明,该方案优于现有方法。

Collaborative Distributed Federated Learning with Parallel Training and Aggregation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

文本数据清理对分析和机器学习项目至关重要,尤其在自然语言处理领域。常见问题包括拼写错误、特殊字符和多余空格。使用Python工具(如Pandas和NLTK)可以自动化清理过程,提升数据质量。关键步骤包括去除噪声、文本规范化、处理缩写、删除重复数据和多余空格。清理后的数据更易于分析,能提高模型的准确性。

如何在5个步骤中使用Python完全自动化文本数据清理

KDnuggets
KDnuggets · 2025-04-21T16:00:24Z

本研究探讨了机器学习预测中评估预测结果与实际动态行为一致性的问题。引入动态指数后,发现标准误差与系统动态特性显著相关,尤其在长期预测中出现动态失真,为提高模型的准确性和可靠性提供了重要信息。

机器学习预测中的动态误差

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-15T00:00:00Z

该研究提出了一种新的持续全细调方案,解决大型语言模型的灾难性遗忘问题。通过自适应奇异值分解,动态识别低秩参数子空间,减少干扰,显著提升模型的准确性和语言能力保留。

塑造子空间:大型语言模型的约束全细调以实现持续学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本研究提出了一种基于公式的监督学习框架(FDSL),旨在解决环境声音分析模型预训练中高质量标记数据不足的问题。通过使用合成数据集Formula-SED进行预训练,显著提升了模型的准确性和训练速度。

公式监督声音事件检测:无真实数据的预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-06T00:00:00Z

本研究探讨了语义保持转换在缺陷检测中的有效性。尽管有93种可重用的转换,最终选用的转换未能提高模型的准确性,显示出实际应用中的挑战和可能导致的语义错误。

Semantic-Preserving Transformations as Mutation Operators: A Study on Their Effectiveness in Defect Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-30T00:00:00Z

本研究提出了一种不确定性感知的政策优化框架,旨在解决模型基强化学习中的策略学习偏差问题。通过主动收集不确定样本以提高模型准确性,实验结果表明该方法在机器人操作和Atari游戏中优于现有技术。

Revisiting Exploration: Uncertainty-Aware Reinforcement Learning with Forward Planning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-26T00:00:00Z

本研究提出了一种分布式分层联邦学习框架,旨在解决未来6G通信系统中非地面网络的效率和隐私问题。该框架通过高空平台整合低轨道卫星与地面客户端的训练,显著提升模型准确性并降低延迟。

非地面网络中的联邦学习:设计、架构与挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究探讨了视觉-语言模型中的幻觉问题,提出了一种跨时间预测连接(TPC)方法,通过增强logits的语义一致性,显著减少幻觉现象,提高模型的准确性和效率。

Cross-Temporal Prediction Connection: Reducing Hallucinations in Vision-Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究提出了Mixtera数据平面,解决了训练数据集增长带来的样本管理问题。用户可以声明性地指定样本的使用比例和顺序,Mixtera在不影响训练效率的情况下,支持数据混合策略,显著提升模型训练准确性。

Mixtera: A Data Plane for Foundation Model Training

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-27T00:00:00Z
生成AI模式:微调

在三十年的软件开发教育中,作者观察到AI的炒作与实际影响并存。文章探讨了生成AI技术在软件产品中的应用,强调评估(Evals)和检索增强生成(RAG)在确保系统有效性中的重要性。团队总结了应对生成AI产品挑战的策略,包括直接提示、嵌入和微调等方法,以提高模型的准确性和可靠性。

生成AI模式:微调

Martin Fowler
Martin Fowler · 2025-02-25T12:20:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码