新加坡Sapient Intelligence公司提出的分层推理模型(HRM)仅用2700万参数和1000个样本,在复杂推理任务中超越大型模型,表明更优的架构设计能显著提升AI性能,改变AI发展方向。
蚂蚁集团发布的MedResearcher-R1模型仅用2100条训练样本,在医疗AI测试中超越通用大模型,展示了专业模型在医疗领域的优势。该模型通过创新训练方法和专用工具,提高了医疗研究的准确性和效率,彰显小规模模型的潜力。
本研究提出了一种新的核心集选择度量——损失轨迹相关性(LTC),有效识别关键训练样本,从而提升深度学习模型在实时或资源受限环境中的可扩展性与效率。
本研究探讨了深度学习中过参数化模型的泛化能力,提出了一种在宽松假设下的有效方法,表明足够的训练样本和网络规模能够实现有效泛化,且数据需求依赖于特定分布。
本研究探讨了在雷达点云中应用混合样本数据增强(MSDA)的挑战,并提出了类感知柱混合(CAPMix)方法。该方法通过在3D点云的柱级别应用带类标签的MixUp,生成多样化的训练样本。实验结果表明,CAPMix显著提升了性能,超越了现有的MSDA方法。
本研究提出了DMin框架,解决了扩散模型中影响估计的计算限制。通过梯度压缩和检索技术,DMin显著降低了存储需求,并快速识别影响性训练样本,实验证明其有效性和高效性。
本文提出使用基尼系数评估向量空间中的多对多相似性,研究表明高基尼系数对应高图像相似性,低基尼系数则相反。此外,选择与测试数据集匹配的训练样本比数据多样性更为重要,能显著提升模型性能。
本研究发现一种新形式的成员推断攻击,使对手能够可靠地取消识别所有训练样本,并且被攻击的模型仍然保持与未受损对照模型相当的性能。研究揭示了成员隐私泄漏的最坏情况,并指出了现有隐私审核方法的一个常见问题。需要重新思考机器学习模型中的隐私审核实践。
本研究提出了一种解决目标检测中由于训练样本有限导致的OOD目标检测准确率低的方法。通过利用相似性特征,提出了原型OOD网络架构,并评估输入特征与原型之间的相似度。实验结果显示该方法在数据集上降低了FPR95,并提高了mAP。
本文提出了一种新的主动学习方法,通过增加较小类别的训练样本,改善了少数类别的性能。在不同预算下,模型的性能都有所提高。最优模型甚至超过了全监督基准模型。
通过对成对示例基于其已观测到的实际结果最小化损失的训练策略,PairNet 能够准确地预测处理变化导致的结果变化,并在多个基准测试中表现出比基准模型更小的 ITE 误差,同时具有模型不可知性和易于实现的优点。
通过解释 AI 系统的决策,例如提供达到子程序目标的反事实解释,来分析 AI 系统的推理是一种流行的可解释 AI(XAI)方法。本文提出了一个新问题,即识别对给定解释(或相关量)有很高影响力的训练数据样本,并研究了受保护群体之间子程序成本差异的特定情况。我们提出了一种算法来识别这样的有影响力的训练样本。
荧光显微镜是生命科学领域不可或缺的重要研究工具,其原理是以紫外线为光源, 照射被检物体使之发出荧光, 然后在显微镜下观察物体的形状及其所在位置,可用于研究细胞内物质的吸收、运输,化学物质的分布及定位等。然而,激发光下的高强度曝露会通过光化学过程直接或间接对细胞造成影响。在长时间活细胞实验中,最好能以最小的光曝露进行荧光观察。但同时,较低的曝光会导致荧光信号较弱,降低图像信噪比...
我们提出了一种新颖的基于算法的方法来描述实例,该方法使用短的探测轨迹来训练算法选择模型,并且在计算效率和结果方面比传统的基于特征的方法更有前景。
人流移动模拟是模拟人员移动的技术,可应用于游戏、城市规划、建筑设计和交通组织等领域。清华大学研究人员提出了一种新的条件去噪扩散模型,通过社会力引导的扩散过程来模拟人群行为。该模型集成了等变性的强归纳偏差,并开发了适用于扩散模型的长程训练算法。实验证明该模型相对于基线方法有显著性能提升。
研究发现,大型语言模型(LLMs)如GPT-4在判断陈述的能力上与人类存在显著差异,高估了无意义陈述的深度。少量训练样本的提示能使LLMs接近人类评分,非思维链式的提示则使LLMs评分远离人类。研究还揭示了强化学习中的潜在偏见。
该研究使用神经网络估计星系样本的红移分布,并证明了不同光学波段信息下该方法的有效性。研究还探讨了训练样本数量不足和数据大小不一致的情况。
本文介绍了使用熵和EL2N评分来评估训练样本的有用性和难度,并展示了如何选择重要样本。结果显示,通过筛选高质量数据集并进行评分选择,语义错误率下降2%,领域分类错误率下降4%-7%。
本研究提出了感知性瑕疵定位(PAL)的方法,通过新数据集训练的分割模型有效定位各类任务中的瑕疵,并展示了该模型在使用极少的训练样本下适应未见过的模型时的高效性。此外,还提出了一种创新的放大补全流程,能够无缝修复生成图像中的感知性瑕疵。数据集和代码已发布。
该文介绍了单向调整(SDT)策略,用于解决高光谱成像分类中训练样本数量有限的问题。同时,引入了一种新的Tri-Former,并进行了比较实验,证明其在多个HSI数据集上表现更好。
完成下面两步后,将自动完成登录并继续当前操作。