利用大型语言模型在迭代范式中结合领域反馈进行分子优化
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对药物发现中的分子优化问题,通过提出一种简单而高效的领域反馈提供器$\text{Re}^2$DF,填补了现有方法的不足。该方法结合RDKit工具处理化学无效的分子并提供反馈,引导大型语言模型在优化过程中更准确地提高目标分子的属性,从而显著提升了优化效果。
该研究提出了一个系统框架,用于比较大型语言模型在化学信息学任务中的微调效果。通过统一训练方法,评估RoBERTa、BART和LLaMA模型在SMILES格式下预测分子性质的表现。分析了18种不同参数和数据集规模的模型,微调于DeepChem的六个基准任务,明确了各模型的优劣,并提供了选择适合特定应用的模型方法。