中山大学团队开发了GraphEC,这是一种基于几何图学习的酶功能预测技术。它利用ESMFold预测结构和预训练的蛋白质语言模型,从蛋白质结构中提取功能信息。GraphEC能有效预测酶的活性位点、EC编号和最佳pH值,表现优于现有方法,具有在合成生物学和基因组学中的应用潜力。未来可通过改进结构质量和结合大型语言模型提升预测能力。
本研究提出了EnzymeFlow模型,结合流匹配和共进化原理,克服了传统酶功能预测的局限性。该模型能够动态生成特定底物和反应的酶催化口袋,实验证明其在酶工程和合成生物学中的有效性。
本文介绍了RITA模型,这是一种自回归生成模型,专注于蛋白质序列,拥有12亿个参数,并训练了2.8亿个蛋白质序列。研究评估了该模型在氨基酸预测和酶功能预测中的表现,展示了规模扩大的优势。同时,文章探讨了大型语言模型在生物分子领域的应用及其性能,强调了多模态学习在生物信息学中的潜力。
完成下面两步后,将自动完成登录并继续当前操作。