大规模多组学生物序列变换器用于建模肽-核苷酸相互作用
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了现有单组学模型无法有效建模核苷酸与肽之间相互作用的难题。我们提出并训练了首个多组学核苷酸-肽基础模型(MOM),该模型能够在未标记的生物序列上学习到符合分子生物学中心法则的联合表征,并在肽-核苷酸相互作用任务中取得了最先进的结果,显示出其在生物信息学中的重要应用潜力。
本研究提出了一种创新的Multi-Peptide方法,结合Transformer语言模型和图神经网络,用于预测肽的特性。该方法利用PeptideBERT和GNN编码器捕捉序列和结构特征,并通过对比式语言-图像预训练将多模态嵌入对齐到一个共享潜空间,提高了预测准确性。在评估中,Multi-Peptide表现出鲁棒性,溶血预测准确率达到86.185%,展示了多模态学习在生物信息学中的潜力。