本文探讨了大型语言模型(LLMs)在下游任务性能上的缩放特性,提出了一种框架来根据训练预算预测基准性能。研究发现,在固定的令牌与参数比率下,简单的幂律可以准确描述多个下游任务的准确率缩放行为。该方法优于传统的两阶段程序,并提供了预测准确率的功能形式。研究团队还发布了完整的预训练损失和下游评估结果,以支持可重复性。
山东理工大学等机构联合开发了PlantLncBoost模型,解决植物lncRNA鉴定的泛化性问题。该模型通过特征优化和算法选择,预测准确率提升至91.7%。研究成果已发表在《New Phytologist》,为植物科学提供了新工具。
我开发了一种利用人工神经网络预测糖尿病风险的工具,旨在改善发展中国家的医疗服务。该系统通过输入患者数据,帮助医疗工作者进行早期干预。尽管面临资源限制和数据偏见,我的模型仍实现了约82%的预测准确率。AI技术在公共卫生中的应用对社区健康中心的早期疾病发现至关重要。
本研究提出了一种利用大型语言模型生成合成数据的方法,以解决自动程序修复中高质量训练数据稀缺的问题。生成了约30,000个错误代码与修复代码的配对示例,显著提高了预测准确率,推动了自动代码维护工具的发展。
本文介绍了Manazel项目,利用13年的新月可见性数据,改进了希吉里月开始日期的预测方法。通过机器学习技术,结合视弧和新月宽度,达到了98.83%的预测准确率,为摩洛哥的希吉里历计算提供了可靠依据。
本研究提出了LeanProgress方法,通过预测证明进度来提高神经定理证明的搜索效率,解决了大型语言模型在数学推理中的幻觉问题。该方法实现了75.1%的预测准确率,并在长证明中性能提升了3.8%。
本研究探讨了人工智能在辅助人类决策中的作用,特别是在人类学习方面。研究表明,优化特征选择可以显著提高决策的准确性,尤其是在早期学习投资中。
本研究提出NDR-QL方法,以解决Q学习收敛速度慢的问题。NDR模型的预测准确率提高了5%,收敛速度比基线快90%。
本研究提出了一种新颖的元学习梯度提升方法(Meta-ED),用于提高急诊科访客预测的准确性。通过分析堪培拉医院23年的外生变量数据,Meta-ED实现了85.7%的预测准确率,显著优于现有技术,显示出其在急诊访客预测中的应用潜力。
本研究探讨大型语言模型(LLMs)在颜色与词语关联方面的不足。尽管GPT-4o在视觉输入下的预测准确率最高,但仍仅约50%,显示出与人类能力之间的显著差距。
本研究提出了一种基于氨基酸微环境的高效注意力模型EMOCPD,旨在提高蛋白质设计的效率和准确性。该模型通过分析氨基酸周围的三维原子环境,显著提升了预测准确率、突变体的热稳定性和蛋白质表达能力。
本文介绍了一种结合差分隐私和安全多方计算的联邦学习方法ProxyFL,旨在保护隐私并提高预测准确率。研究探讨了基于自然语言的分类、预训练模型及无监督学习等新方法,并在多个数据集上验证了其优越性。提出的Fed-PLT算法有效减少通信轮次,同时保持准确性,展示了联邦学习在隐私保护和效率上的新进展。
本文提出了一种新型可解释模型,结合监督与无监督学习,优化模型性能并减少计算量。研究展示了通过概念瓶颈模型(CBM)和交互式机制提升预测准确率,并引入自适应模块增强分类性能。新框架Label-free CBM能够在无标记数据下实现高效转换,未来有望广泛应用。
Clover是一种新推理解码算法,通过将顺序知识融入并行解码,提高了预测准确率和效率。实验证明,Clover在Baichuan-Small和Baichuan-Large上分别提高了最多91%和146%。该算法结合了经典与新型推测解码技术,显著提升了大型语言模型的解码效率,降低了推理时间。
本文研究了自动补全模型,提出了一种新的标准,并发现现有模型性能不足。INarIG模型在单词级自动补全任务中表现优异,尤其在处理低频词时提高了预测准确率。此外,研究展示了基于神经网络的查询自动完成系统,改善了用户搜索体验。
PaddleX的零代码计算机视觉模型生产线升级,新增了时间序列分析的三个主要任务:时间序列预测、异常检测和分类。升级还引入了五条专门针对时间序列场景设计的零代码生产线,涵盖了11个前沿的时间序列模型,旨在为开发者提供方便高效的时间序列任务处理能力。升级还包括了一个高精度的多模型融合时间序列生产线,预测准确率提高了约20%,异常检测准确率提高了5%。该生产线支持云端和本地部署,可离线使用。
本研究提出了一种多模态深度学习模型,结合转换器编码器和预训练语言模型,能够准确预测大学生的情感状态。经过一年的纵向研究,该模型在预测积极和消极情感方面的准确率分别为82.50%和82.76%。模型的解释性增强了其有效性,对情感计算的应用具有重要启示。
本文探讨了合成孔径雷达(SAR)图像识别中的对抗攻击方法,包括散射物攻击(OTSA)和SAR-AE-SFP攻击,显著提高了攻击效率。通过自监督学习和对抗训练,提出了改进的模型,提升了预测准确率,并在气候变化监测中减少了标记数据需求。
本文讨论了机器遗忘的研究,重点在于通过差分隐私算法有效删除训练模型中的特定数据点。提出了一种基于噪声随机梯度下降的遗忘框架,展示了隐私、效用和复杂性之间的权衡。实验结果表明,该方法在保护隐私的同时保持模型性能,并提高了多种任务的预测准确率。
通过改变CNN-LSTM和自回归模型的输入数据形状,提出了一种新的特征工程方法,以提高对噪声的处理能力。研究结果表明,该方法能够以83%的准确率预测长达24个时间步的未见数据,并在短期、中期和长期预测方面表现出较高的准确性。
完成下面两步后,将自动完成登录并继续当前操作。