基于METiS去新脂质库的脂质语言模型LipidBERT
原文中文,约400字,阅读约需1分钟。发表于: 。本研究针对传统脂质表征方法的不足,提出了一种新颖的预训练模型LipidBERT,该模型通过在10百万种虚拟脂质的数据库上进行学习,有效提升了LNP性质预测的精度。研究表明,LipidBERT在脂质生成和下游任务中表现出色,为未来有机靶向LNP候选物的筛选提供了强大的AI支持。
ProtLLM是一个通用的跨模态大语言模型,用于处理自然语言文本与蛋白质交织在一起的复杂输入。通过训练ProtLLM的蛋白质作为单词的语言建模方法,模型能够预测自然语言和蛋白质。此外,通过构建大规模的交织蛋白质-文本数据集InterPT,ProtLLM能够理解蛋白质的重要知识。实验证明,ProtLLM在蛋白质中心任务和蛋白质语言任务上表现出卓越性能。