小红花·文摘

将AI驱动的蛋白质设计工具带给全球生物学家

MIT News - Artificial intelligence ·

随着人工智能的发展，蛋白质工程进入AI辅助设计阶段。为降低使用门槛，上海交通大学开发了VenusFactory平台，简化数据检索和模型训练，支持无代码操作，促进生物科学研究。该平台整合多个数据库，提供核心任务评测，助力科学家高效研究。

覆盖40+主流模型及数据集，上海交大团队发布一站式蛋白质工程设计平台VenusFactory，一键部署教程已上线

HyperAI超神经 ·

本研究提出了一种新型蛋白质语言模型Prot42，旨在解决传统蛋白质工程的复杂性和资源消耗问题。Prot42能够生成高亲和力的蛋白质结合剂，并处理长达8192个氨基酸的序列，显著提升计算蛋白设计能力。

Prot42：一种针对目标的蛋白质结合剂生成的全新蛋白质语言模型家族

BriefGPT - AI 论文速递 ·

仅输入prompt与序列，准确率超90%，UC伯克利等提出文本生成蛋白质多模态框架

机器之心 ·

本研究探讨神经符号人工智能（NeSy）在医疗领域的应用，特别是在药物发现和蛋白质工程中的潜力。NeSy结合符号推理与深度学习，能够处理复杂医疗数据并提供解释能力，提出了改进策略和未来实验建议。

A Study on Neuro-Symbolic Artificial Intelligence: Healthcare Perspectives

BriefGPT - AI 论文速递 ·

VenusFactory是一个统一的蛋白质工程数据检索与语言模型微调平台，旨在解决数据收集和任务基准测试的挑战，促进计算机科学与生物学的跨学科合作。

VenusFactory: A Unified Platform for Protein Engineering Data Retrieval and Language Model Fine-Tuning

BriefGPT - AI 论文速递 ·

上海交通大学洪亮教授团队推出了VenusMutHub，这是首个针对真实应用场景的蛋白质突变小样本数据集，并提出了评测标准。该研究克服了现有高通量数据集的局限性，为蛋白质工程提供实用指导，推动了蛋白质功能预测的发展。

蛋白质突变工程 AI 模型评测新基准，上海交大洪亮教授团队发布 VenusMutHub

HyperAI超神经 ·

AI做生物实验？还能迭代？浙大集成PLM和「自动化生物工厂」革新蛋白质工程范式

机器之心 ·

成功率达100%，上交团队提出AI辅助的酶热稳定性工程策略，设计热稳定性的组合突变体

机器之心 ·

合成生物学中人工智能的测试

DEV Community ·

近年来，产学研用结合在AI领域愈发重要。洪亮教授指出，科研应关注实际问题，AI在蛋白质工程等领域取得了重要突破，推动产业化。团队合作与跨学科研究是成功的关键，未来需继续探索AI与科学的结合。

对话上海交大洪亮：跑通 AI for Science 的落地更有成就感

HyperAI超神经 ·

浙江大学团队开发了去噪蛋白质语言模型（DePLM），通过去除无关进化信息，提高蛋白质优化和泛化能力。DePLM在突变效应预测中优于现有模型，并能有效泛化到新蛋白质。研究结合进化信息与实验数据，推动蛋白质工程发展。

入选NeurIPS 24！浙大团队提出全新去噪蛋白质语言模型DePLM，突变效应预测优于SOTA模型

HyperAI超神经 ·

在「Meet AI4S」直播中，周子宜博士介绍了蛋白质语言模型（PLM）在蛋白质工程中的应用。PLM通过建模蛋白质序列的共进化信息来预测突变的适应性，并生成蛋白质。研究重点包括检索增强型、多模态PLM和小样本学习方法FSFP。FSFP通过排序学习、LoRA和元学习提升性能，适用于不同PLM。未来方向包括AI辅助定向进化中的主动学习策略。

登 Nature 子刊！论文一作详解蛋白质语言模型的小样本学习方法，解决湿实验数据匮乏难题

HyperAI超神经 ·

浙江大学的研究团队提出了一种名为InstructProtein的模型，通过知识指令对齐蛋白质语言和人类语言，实现了双向生成能力。该模型在蛋白质序列理解和设计方面优于现有的大语言模型。研究人员使用UniProtKB构建了蛋白质知识图谱，并通过指令数据集进行模型微调。InstructProtein能够准确预测蛋白质的功能和位置，对蛋白质工程和药物发现具有重要意义。该研究为蛋白质大模型的发展提供了新的思路和方法。

入选ACL2024主会 | InstructProtein：利用知识指令对齐蛋白质语言与人类语言

HyperAI超神经 ·

本研究提出多种基于扩散模型的蛋白质设计方法，旨在生成高质量、特定功能的蛋白质结构。通过结合生物信息和图神经网络，提升了生成效率和结构稳定性，展示了在蛋白质工程领域的应用潜力。

基于二级结构指导的潜在图扩散的新蛋白质序列生成

BriefGPT - AI 论文速递 ·

上海交通大学洪亮课题组研发了一种名为PROTLGN的微环境感知图神经网络，能够从蛋白质三维结构中学习并预测有益的氨基酸突变位点，指导蛋白质设计。PROTLGN具有更高的效率和准确性，可用于突变预测、荧光蛋白优化、VHH抗体设计和Ago蛋白突变等方面。此外，PROTLGN还能预测蛋白质的亚细胞定位。

无实验数据指导蛋白质定向进化，上海交大洪亮课题组发表微环境感知图神经网络 ProtLGN

HyperAI超神经 ·

本文探讨了机器学习技术在预测分子离子化能量和基因组测序中的应用。研究表明，优化训练集和模型可以显著提高预测准确性。此外，机器学习指导的定向进化方法在蛋白质工程中表现优异，成功创造出高催化选择性的变异体。

自然离散组合突变易导致数据误差的机器学习中的数据规模缩放：以肽和小分子为案例研究

BriefGPT - AI 论文速递 ·