小红花·文摘

重新审视大型语言模型训练中下游指标的缩放特性

Apple Machine Learning Research ·

山东理工大学等机构联合开发了PlantLncBoost模型，解决植物lncRNA鉴定的泛化性问题。该模型通过特征优化和算法选择，预测准确率提升至91.7%。研究成果已发表在《New Phytologist》，为植物科学提供了新工具。

整合多源植物转录组数据，山东理工大学等构建PlantLncBoost模型，跨物种lncRNA预测准确率最高达96%

HyperAI超神经 ·

利用人工智能预测糖尿病：基于神经网络的方法以改善健康结果

DEV Community ·

本研究提出了一种利用大型语言模型生成合成数据的方法，以解决自动程序修复中高质量训练数据稀缺的问题。生成了约30,000个错误代码与修复代码的配对示例，显著提高了预测准确率，推动了自动代码维护工具的发展。

合成代码修复：利用大型语言模型和合成数据修复错误和漏洞

BriefGPT - AI 论文速递 ·

本文介绍了Manazel项目，利用13年的新月可见性数据，改进了希吉里月开始日期的预测方法。通过机器学习技术，结合视弧和新月宽度，达到了98.83%的预测准确率，为摩洛哥的希吉里历计算提供了可靠依据。

When Astronomy Meets Artificial Intelligence: Manazel for Crescent Visibility Prediction in Morocco

BriefGPT - AI 论文速递 ·

本研究提出了LeanProgress方法，通过预测证明进度来提高神经定理证明的搜索效率，解决了大型语言模型在数学推理中的幻觉问题。该方法实现了75.1%的预测准确率，并在长证明中性能提升了3.8%。

LeanProgress: Guiding Search for Neural Theorem Proving via Proof Progress Prediction

BriefGPT - AI 论文速递 ·

本研究探讨了人工智能在辅助人类决策中的作用，特别是在人类学习方面。研究表明，优化特征选择可以显著提高决策的准确性，尤其是在早期学习投资中。

AI-Assisted Human Decision Making

BriefGPT - AI 论文速递 ·

本研究提出NDR-QL方法，以解决Q学习收敛速度慢的问题。NDR模型的预测准确率提高了5%，收敛速度比基线快90%。

神经网络驱动的奖励预测作为启发式：推进移动机器人路径规划中的Q学习

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的元学习梯度提升方法（Meta-ED），用于提高急诊科访客预测的准确性。通过分析堪培拉医院23年的外生变量数据，Meta-ED实现了85.7%的预测准确率，显著优于现有技术，显示出其在急诊访客预测中的应用潜力。

Effective Predictive Modeling for Emergency Department Visits and Evaluating the Impact of Exogenous Variables: Using Explainable Meta-learning Gradient Boosting

BriefGPT - AI 论文速递 ·

本研究探讨大型语言模型（LLMs）在颜色与词语关联方面的不足。尽管GPT-4o在视觉输入下的预测准确率最高，但仍仅约50%，显示出与人类能力之间的显著差距。

大型语言模型在再现人类颜色-词语关联中的进展与局限性

BriefGPT - AI 论文速递 ·

本研究提出了一种基于氨基酸微环境的高效注意力模型EMOCPD，旨在提高蛋白质设计的效率和准确性。该模型通过分析氨基酸周围的三维原子环境，显著提升了预测准确率、突变体的热稳定性和蛋白质表达能力。

EMOCPD: A Study on Computational Protein Design Based on Efficient Attention Models

BriefGPT - AI 论文速递 ·

本文介绍了一种结合差分隐私和安全多方计算的联邦学习方法ProxyFL，旨在保护隐私并提高预测准确率。研究探讨了基于自然语言的分类、预训练模型及无监督学习等新方法，并在多个数据集上验证了其优越性。提出的Fed-PLT算法有效减少通信轮次，同时保持准确性，展示了联邦学习在隐私保护和效率上的新进展。

FedHide:通过邻居隐匿实现联邦学ä¹

BriefGPT - AI 论文速递 ·

本文提出了一种新型可解释模型，结合监督与无监督学习，优化模型性能并减少计算量。研究展示了通过概念瓶颈模型（CBM）和交互式机制提升预测准确率，并引入自适应模块增强分类性能。新框架Label-free CBM能够在无标记数据下实现高效转换，未来有望广泛应用。

通过任意概念解释：具有开放词汇概念的概念瓶颈模型

BriefGPT - AI 论文速递 ·

Clover是一种新推理解码算法，通过将顺序知识融入并行解码，提高了预测准确率和效率。实验证明，Clover在Baichuan-Small和Baichuan-Large上分别提高了最多91%和146%。该算法结合了经典与新型推测解码技术，显著提升了大型语言模型的解码效率，降低了推理时间。

Clover-2：精确的回归式轻量级推理解码

BriefGPT - AI 论文速递 ·

本文研究了自动补全模型，提出了一种新的标准，并发现现有模型性能不足。INarIG模型在单词级自动补全任务中表现优异，尤其在处理低频词时提高了预测准确率。此外，研究展示了基于神经网络的查询自动完成系统，改善了用户搜索体验。

计算辅助翻译中的基于能量的词级自动补全模型

BriefGPT - AI 论文速递 ·

PaddleX的零代码计算机视觉模型生产线升级，新增了时间序列分析的三个主要任务：时间序列预测、异常检测和分类。升级还引入了五条专门针对时间序列场景设计的零代码生产线，涵盖了11个前沿的时间序列模型，旨在为开发者提供方便高效的时间序列任务处理能力。升级还包括了一个高精度的多模型融合时间序列生产线，预测准确率提高了约20%，异常检测准确率提高了5%。该生产线支持云端和本地部署，可离线使用。

高精度时序分析星河零代码产线上线，全面覆盖3大时序场景任务

百度大脑 ·

本研究提出了一种多模态深度学习模型，结合转换器编码器和预训练语言模型，能够准确预测大学生的情感状态。经过一年的纵向研究，该模型在预测积极和消极情感方面的准确率分别为82.50%和82.76%。模型的解释性增强了其有效性，对情感计算的应用具有重要启示。

Hi-EF：人际互动中情感预测的基准测试

BriefGPT - AI 论文速递 ·

本文探讨了合成孔径雷达（SAR）图像识别中的对抗攻击方法，包括散射物攻击（OTSA）和SAR-AE-SFP攻击，显著提高了攻击效率。通过自监督学习和对抗训练，提出了改进的模型，提升了预测准确率，并在气候变化监测中减少了标记数据需求。

掩盖 SAR 图像中的本地篡改：一种反鉴定攻击

BriefGPT - AI 论文速递 ·

本文讨论了机器遗忘的研究，重点在于通过差分隐私算法有效删除训练模型中的特定数据点。提出了一种基于噪声随机梯度下降的遗忘框架，展示了隐私、效用和复杂性之间的权衡。实验结果表明，该方法在保护隐私的同时保持模型性能，并提高了多种任务的预测准确率。

基于梯度训练的差分隐私和遗忘的证明

BriefGPT - AI 论文速递 ·

本文探讨了深度学习模型在乳腺癌浸润性导管癌（IDC）诊断中的应用。研究显示，深度残差卷积网络的预测准确率高达99.29%，迁移学习和支持向量机分类器也显著提高了分类准确性。使用Vision Transformer模型的研究表明，其准确性和效率优于传统卷积神经网络，达到了95.15%的准确率。

基于有监督对比视觉变换器的乳腺组织病理图像分类

BriefGPT - AI 论文速递 ·