随机森林和梯度提升是两种常用的机器学习算法。随机森林通过并行训练多个决策树来减少方差,适合快速开发模型;而梯度提升则顺序构建模型,逐步纠正错误,适合追求最高预测准确度的场景。在选择时需考虑速度、可解释性和性能需求。
微软亚洲研究院与清华、北大联合提出强化预训练(RPT),将强化学习深度融入大语言模型(LLM)预训练,提升模型的推理能力和下一个token预测准确度。实验结果显示,RPT-14B在多种任务上优于传统模型,展现出更强的推理能力和潜力。
本研究提出了一种物理信息自监督学习方法,成功解决了在缺乏真实能量值情况下推断能量景观的难题。实验结果表明,估计的能量与真实值的相关系数超过0.9,演化预测准确度提高了17.65%以上,验证了该方法的有效性。
本文提出了一种基于信息瓶颈原理的图随机注意力方式,用于解释学习过程中选择任务相关亚图,并保证这些亚图中不包含与任务不相关的模式,并在8个数据集上进行了广泛的实验,结果表明该方法比现有方法在解释和预测准确度上都有更好的表现。
特征重要性是影响预测结果的关键特征。置换重要性是一种常用方法,通过随机打乱验证数据中的某一特征列,观察预测准确度的变化来评估特征的重要性。准确度下降越多,表明该特征越重要。该方法可通过多次打乱计算平均值,以减少随机性影响。
STARNet是一种用于检测不可信传感器流的传感器可信度和异常识别网络,可提高预测准确度。
本研究提出了一种名为多模型线性回归(MMLR)的新定义的回归模型,将输入数据集分成子集并构建局部线性回归模型。研究还提出了一种基于(ε,δ)- 估计器的近似算法来构建 MMLR 模型,并对 MMLR 算法的正确性和效率进行了数学证明。实证实验结果显示算法在许多情况下具有与现有回归方法可比的性能,同时提供了很高的预测准确度而几乎不需要花费过多时间。
本文提出了一种基于最大边际相关性的全新集成构建和维护方法(DynED),该方法在构建集成的过程中动态地将组件的多样性和预测准确性进行结合。实验结果表明,该方法在四个真实和11个合成数据集上提供了更高的平均准确度。
完成下面两步后,将自动完成登录并继续当前操作。