本文介绍了分子语言模型MolGen和基于扩散语言模型的文本导向分子生成方法TGM-DLM。MolGen通过多任务学习提升分子生成性能,而TGM-DLM克服了自回归方法的局限,能够生成特定描述的分子。此外,研究探讨了约束文本生成和多语种推理能力,并提出了高效的生成模型和AI创作助手CTGS,展示了在多个任务中的显著改进。
本文介绍了一种基于扩散语言模型的文本导向分子生成方法(TGM-DLM),该方法克服了自回归方法的局限性,通过两阶段的扩散生成过程更新SMILES字符串中的标记嵌入。实验证明,TGM-DLM模型在生成具有特定属性的连贯准确分子方面优于自回归模型MolT5-Base,无需额外数据资源,为药物发现和相关科学领域开辟新途径。
完成下面两步后,将自动完成登录并继续当前操作。