小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
HRM 架构突破:用仅 2700 万参数和 1000 个训练样本超越最先进的大语言模型

新加坡Sapient Intelligence公司提出的分层推理模型(HRM)仅用2700万参数和1000个样本,在复杂推理任务中超越大型模型,表明更优的架构设计能显著提升AI性能,改变AI发展方向。

HRM 架构突破:用仅 2700 万参数和 1000 个训练样本超越最先进的大语言模型

Micropaper
Micropaper · 2026-03-02T11:30:00Z

蚂蚁集团发布的MedResearcher-R1模型仅用2100条训练样本,在医疗AI测试中超越通用大模型,展示了专业模型在医疗领域的优势。该模型通过创新训练方法和专用工具,提高了医疗研究的准确性和效率,彰显小规模模型的潜力。

蚂蚁专用模型超越o3!仅用2K训练样本刷新医疗AI榜单纪录

量子位
量子位 · 2025-08-29T05:27:36Z

本研究提出了一种新的核心集选择度量——损失轨迹相关性(LTC),有效识别关键训练样本,从而提升深度学习模型在实时或资源受限环境中的可扩展性与效率。

发现缪斯:通过损失轨迹识别核心集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-12T00:00:00Z

本研究探讨了深度学习中过参数化模型的泛化能力,提出了一种在宽松假设下的有效方法,表明足够的训练样本和网络规模能够实现有效泛化,且数据需求依赖于特定分布。

基于表达能力的神经网络经验风险最小化的可泛化性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究探讨了在雷达点云中应用混合样本数据增强(MSDA)的挑战,并提出了类感知柱混合(CAPMix)方法。该方法通过在3D点云的柱级别应用带类标签的MixUp,生成多样化的训练样本。实验结果表明,CAPMix显著提升了性能,超越了现有的MSDA方法。

Class-Aware PillarMix: Can Mixed Sample Data Augmentation Enhance 3D Object Detection with Radar Point Clouds?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z

本研究提出了DMin框架,解决了扩散模型中影响估计的计算限制。通过梯度压缩和检索技术,DMin显著降低了存储需求,并快速识别影响性训练样本,实验证明其有效性和高效性。

DMin:适用于扩散模型的可扩展训练数据影响估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本文提出使用基尼系数评估向量空间中的多对多相似性,研究表明高基尼系数对应高图像相似性,低基尼系数则相反。此外,选择与测试数据集匹配的训练样本比数据多样性更为重要,能显著提升模型性能。

基尼系数作为评估向量空间中多对多相似性的统一指标

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z

本研究发现一种新形式的成员推断攻击,使对手能够可靠地取消识别所有训练样本,并且被攻击的模型仍然保持与未受损对照模型相当的性能。研究揭示了成员隐私泄漏的最坏情况,并指出了现有隐私审核方法的一个常见问题。需要重新思考机器学习模型中的隐私审核实践。

抓住我,如果你能:检测深度学习模型中的未经授权的数据使用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z

本研究提出了一种解决目标检测中由于训练样本有限导致的OOD目标检测准确率低的方法。通过利用相似性特征,提出了原型OOD网络架构,并评估输入特征与原型之间的相似度。实验结果显示该方法在数据集上降低了FPR95,并提高了mAP。

原型OOD:通过原型特征相似性增强OOD目标检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

本文提出了一种新的主动学习方法,通过增加较小类别的训练样本,改善了少数类别的性能。在不同预算下,模型的性能都有所提高。最优模型甚至超过了全监督基准模型。

动态标签注入用于不平衡工业缺陷分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z

通过对成对示例基于其已观测到的实际结果最小化损失的训练策略,PairNet 能够准确地预测处理变化导致的结果变化,并在多个基准测试中表现出比基准模型更小的 ITE 误差,同时具有模型不可知性和易于实现的优点。

PairNet: 使用观察到的对作为训练样本以估计个体处理效果

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-06T00:00:00Z

通过解释 AI 系统的决策,例如提供达到子程序目标的反事实解释,来分析 AI 系统的推理是一种流行的可解释 AI(XAI)方法。本文提出了一个新问题,即识别对给定解释(或相关量)有很高影响力的训练数据样本,并研究了受保护群体之间子程序成本差异的特定情况。我们提出了一种算法来识别这样的有影响力的训练样本。

分析训练样本对解释的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-05T00:00:00Z

荧光显微镜是生命科学领域不可或缺的重要研究工具,其原理是以紫外线为光源, 照射被检物体使之发出荧光, 然后在显微镜下观察物体的形状及其所在位置,可用于研究细胞内物质的吸收、运输,化学物质的分布及定位等。然而,激发光下的高强度曝露会通过光化学过程直接或间接对细胞造成影响。在长时间活细胞实验中,最好能以最小的光曝露进行荧光观察。但同时,较低的曝光会导致荧光信号较弱,降低图像信噪比...

收集30GB、近20万对训练样本,复旦大学团队发布UniFMIR:用AI突破显微成像极限

HyperAI超神经
HyperAI超神经 · 2024-05-17T06:12:17Z

我们提出了一种新颖的基于算法的方法来描述实例,该方法使用短的探测轨迹来训练算法选择模型,并且在计算效率和结果方面比传统的基于特征的方法更有前景。

通过学习辨别性训练样本来改善算法选择和性能预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-08T00:00:00Z

人流移动模拟是模拟人员移动的技术,可应用于游戏、城市规划、建筑设计和交通组织等领域。清华大学研究人员提出了一种新的条件去噪扩散模型,通过社会力引导的扩散过程来模拟人群行为。该模型集成了等变性的强归纳偏差,并开发了适用于扩散模型的长程训练算法。实验证明该模型相对于基线方法有显著性能提升。

仅需 5% 训练样本达到最优性能,清华大学研究团队发布条件去噪扩散模型 SPDiff,实现长程人流移动模拟

HyperAI超神经
HyperAI超神经 · 2024-03-12T04:19:43Z

研究发现,大型语言模型(LLMs)如GPT-4在判断陈述的能力上与人类存在显著差异,高估了无意义陈述的深度。少量训练样本的提示能使LLMs接近人类评分,非思维链式的提示则使LLMs评分远离人类。研究还揭示了强化学习中的潜在偏见。

用于心理语言学合理性预测的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-08T00:00:00Z

该研究使用神经网络估计星系样本的红移分布,并证明了不同光学波段信息下该方法的有效性。研究还探讨了训练样本数量不足和数据大小不一致的情况。

使用卷积神经网络进行精确剪切测量时,点扩散函数估计误差和星系总体偏差的影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-04T00:00:00Z

本文介绍了使用熵和EL2N评分来评估训练样本的有用性和难度,并展示了如何选择重要样本。结果显示,通过筛选高质量数据集并进行评分选择,语义错误率下降2%,领域分类错误率下降4%-7%。

您需要多少验证标签?探索标签效率模型排序的设计空间

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-04T00:00:00Z

本研究提出了感知性瑕疵定位(PAL)的方法,通过新数据集训练的分割模型有效定位各类任务中的瑕疵,并展示了该模型在使用极少的训练样本下适应未见过的模型时的高效性。此外,还提出了一种创新的放大补全流程,能够无缝修复生成图像中的感知性瑕疵。数据集和代码已发布。

叠字文献中重叠字符的语义分割的深度学习实验

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-02T00:00:00Z

该文介绍了单向调整(SDT)策略,用于解决高光谱成像分类中训练样本数量有限的问题。同时,引入了一种新的Tri-Former,并进行了比较实验,证明其在多个HSI数据集上表现更好。

通过单向调节进行高光谱图像分类的传感器连接

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-22T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码