山东理工大学等机构联合开发了PlantLncBoost模型,解决植物lncRNA鉴定的泛化性问题。该模型通过特征优化和算法选择,预测准确率提升至91.7%。研究成果已发表在《New Phytologist》,为植物科学提供了新工具。
本研究提出了一种双个体遗传算法用于优化二元图像分类中的神经网络,通过领导者和跟随者角色进行特征优化,训练准确率达到99.04%,优于传统方法。
特征工程是机器学习和数据分析中的关键过程,通过提取有用特征、清洗数据和优化算法性能来使数据适应机器学习算法。常用技术包括异常值检测、独热编码、对数转换、降维和处理缺失值等。特征工程对于发挥机器学习项目潜力至关重要。
该文提出了一个基于概念的解释性方法的框架,并将其扩展到NLP领域。通过从预训练模型的隐藏层激活中提取具有预测高水平特征(概念),优化具有高影响力的特征的存在,并设立了多种评估指标。实验结果表明,该方法在预测影响、可用性和忠实度方面都取得了卓越的结果。
完成下面两步后,将自动完成登录并继续当前操作。