本研究提出拉普拉斯样本信息(LSI),通过贝叶斯视角准确估计数据集中个体样本的信息量。LSI结合信息理论和KL散度方法,有效识别数据典型性、检测标签错误及评估数据集难度,从而提升样本选择效率和模型准确性,适用于图像和文本数据训练任务。
本研究提出了一种新样本选择方法,针对噪声标签下的图像分类,能够有效识别正确标记的困难样本。通过跟踪模型预测置信度的变化,提高了样本选择的精度和召回率,实验结果表明该方法显著提升了噪声标签学习的性能。
本研究提出了一种名为ConFrag的新方法,旨在解决噪声标签的回归问题。通过将数据转化为不连贯片段对,ConFrag提高了样本选择的准确性,并在处理标签噪声时表现优异,超越了十四个基线方法,展现出强大的鲁棒性。
最新研究表明,在强化学习中,数据的质量比数量更为重要。通过学习影响力度量(LIM),研究者发现精选的1,389个样本的效果超过了8,523个样本,强调了高质量样本对模型学习的重要性。这一发现挑战了传统观念,为高效训练提供了新方法。
本文探讨了影响强化学习训练数据提升语言模型推理能力的因素,提出了“学习影响测量”(LIM)方法,表明通过精心选择的1,389个样本可以超越8,523个样本的数据集表现,强调了样本选择的重要性。
本研究提出SALN方法,通过优先选择样本,提高深度学习模型的训练效率和准确性。实验结果显示,训练时间减少8倍,准确性提升5%。
本研究探讨了上下文学习(ICL)在多示例模式下的样本选择敏感性,特别关注长上下文语言模型(LCLMs)。实验结果显示,简单随机选择样本未显著提升性能,而数据增强方法有效提高了ICL性能,提升幅度达到5%。
本研究提出了一种新方法LeaDQ,旨在解决联邦学习中未标记数据流的样本选择问题。通过多智能体强化学习优化客户端策略,显著提高了全球模型的准确性,实验结果表明其优于现有基准算法。
本研究提出了一种主动学习方法,旨在提高呼吸疾病诊断中的数据获取和标注效率。该方法通过智能样本选择,降低资源消耗,并实现与传统模型相当的效果。
本文介绍了一种测试Web应用防火墙(WAF)性能的方法,通过四个关键指标进行评估。作者使用开源工具和样本进行测试,得出了不同WAF的性能比较结果。SafeLine表现最佳,Coraza和ModSecurity的检测率高但误报率也较高。文章强调了根据实际情况选择适当的样本和方法进行测试的重要性。
完成下面两步后,将自动完成登录并继续当前操作。