ReactXT:通过反应上下文化的分子 - 文本预训练理解分子之 “反应关系
内容提要
本文探讨了利用自然语言描述增强化学预测模型的方法,提出了TextReact,通过对文献中的文本与分子表示进行对齐,显著提升了反应条件推荐和逆合成的预测性能。同时,研究介绍了多种基于预训练语言模型的创新方法,强调了文本在化学反应预测中的重要性。
关键要点
-
本文研究了在化学领域中使用自然语言描述来增强预测模型。
-
引入了TextReact方法,通过对文献中检索到的文本与反应的分子表示进行对齐,提升了反应条件推荐和逆合成的预测性能。
-
TextReact在预测器训练中加入了辅助的掩码语言模型目标,增强了文本与分子表示的对齐效果。
-
研究表明,TextReact显著优于仅基于分子数据训练的化学信息模型。
-
提出了MolXPT模型,结合了来自PubMed的文本序列和PubChem的SMILES序列进行预训练,取得了超越强基线的性能。
-
通过结合过程文本和主要方法改进Graphormer反应模型的准确性,提高了对不良反应的辨别能力。
-
利用深度神经网络中的基于Transformer的方法,解决了多种有机化学应用问题,并展示了预训练模型的出色性能。
-
研究还介绍了多模态分子结构-文本模型MoleculeSTM,结合学习化学结构和文本描述,提高药物设计的效率和创新能力。
-
提出了以文本辅助的逆合成预测方法T-Rex,显著优于基于图结构的最先进方法,展示了预训练语言模型生成的文本在逆合成预测中的潜力。
延伸问答
TextReact方法是如何提升化学反应预测性能的?
TextReact通过对文献中检索到的文本与反应的分子表示进行对齐,显著提升了反应条件推荐和逆合成的预测性能。
MolXPT模型的主要特点是什么?
MolXPT模型结合了来自PubMed的文本序列和PubChem的SMILES序列进行预训练,取得了超越强基线的性能。
如何利用文本辅助的逆合成预测方法T-Rex?
T-Rex通过生成目标分子的描述和分子图的结构来生成候选反应中心,并使用候选反应物的描述进行重新排序,从而更好地合成目标分子。
多模态分子结构-文本模型MoleculeSTM的优势是什么?
MoleculeSTM结合学习化学结构和文本描述,提高了药物设计的效率和创新能力,并在多个基准测试中获得了最先进的泛化能力。
预训练语言模型在化学反应预测中的重要性是什么?
预训练语言模型生成的文本可以大大提高逆合成预测,为计算化学的进步提供了新的途径。
Graphormer反应模型是如何改进的?
通过结合过程文本和使用ReacLLaMA-Adapter与Zero-Shot Labeling ReacLLaMA两种主要方法,Graphormer反应模型的准确性得到了提升。