上海交通大学将于2025年8月举办第三届「AI for Bioengineering 暑期学校」,吸引200余位青年学者探讨AI与生物工程的结合。李明辰博士介绍了蛋白质语言模型在功能预测和序列生成方面的研究进展,并提出了一种基于蛋白质结构、序列和功能的新分类方法,强调了其在突变预测和蛋白质设计中的应用。
该研究通过训练自回归和自编码器模型,开发了多种蛋白质语言模型,提升了蛋白质功能预测的准确性。新模型如xTrimoPGLM和Prot2Text结合了结构信息和文本数据,显著增强了蛋白质的理解和生成能力,推动了计算生物学的发展。
RNAFlow 是一种新型 RNA 序列结构设计方法,结合 RNA 逆折叠模型和 RosettaFold2NA 网络,简化训练过程并增强构象模拟。RNA-FrameFlow 引入生成模型用于 3D RNA 骨架设计,解决 RNA 建模中的挑战,生成符合有效性标准的局部真实 RNA 骨架。gRNAde 提出几何 RNA 设计流程,改善多状态 RNA 的生产。FoldFlow-2 改进蛋白质结构生成能力,rnaglib 训练模型预测 RNA 功能。
本文介绍了一种基于3D蛋白质结构的自监督学习方法,利用图神经网络进行预训练,显著提高了蛋白质功能和结构预测的准确性。研究表明,该方法在多个任务中表现优越,且所需的预训练数据更少。
ProtChatGPT 和 ProtLLM 是用于蛋白质研究的先进语言模型,能够处理蛋白质结构与自然语言的复杂输入。这些模型通过构建大规模数据集和创新的预训练框架,在蛋白质理解和生成任务上表现出色,提供准确的功能预测,推动蛋白质科学的发展。
完成下面两步后,将自动完成登录并继续当前操作。