研究使用对比自监督学习训练FT-Transformer模型,从miRNA、mRNA或RPPA数据预测癌症类型。相比XGBoost和CatBoost,该模型在标记样本稀缺时表现更好。提出的多模态模型通过后融合处理不同组学,实验显示多模态预训练提升了单一组学的预测效果,尤其在未标记多模态样本丰富时。适用于大量未标记数据但标记样本稀缺的情况。
生物信息学中的关键词为算法、深度学习、超维计算、组学数据。超维计算在生物信息学中具有潜力,能够处理多模态和结构化数据,对组学数据搜索、生物信号分析和健康应用有巨大潜力。
研究人员提出了一种名为PathFormer的新型GNN模型结构,用于排序和预测生物标志物,具有高度准确的预测能力。该模型在疾病诊断方面提高了30%的准确性,并在不同数据集上具有较高的生物标志物排名的可重复性。该模型在阿尔茨海默病和癌症转录组数据集上得到验证,并可应用于其他组学数据分析研究。
完成下面两步后,将自动完成登录并继续当前操作。