利用大型语言模型在迭代范式中结合领域反馈进行分子优化

本研究针对药物发现中的分子优化问题，通过提出一种简单而高效的领域反馈提供器$\text{Re}^2$DF，填补了现有方法的不足。该方法结合RDKit工具处理化学无效的分子并提供反馈，引导大型语言模型在优化过程中更准确地提高目标分子的属性，从而显著提升了优化效果。

该研究提出了一个系统框架，用于比较大型语言模型在化学信息学任务中的微调效果。通过统一训练方法，评估RoBERTa、BART和LLaMA模型在SMILES格式下预测分子性质的表现。分析了18种不同参数和数据集规模的模型，微调于DeepChem的六个基准任务，明确了各模型的优劣，并提供了选择适合特定应用的模型方法。

DeepChem SMILES 化学信息学大型语言模型微调