基于文本引导的多性质分子优化与扩散语言模型
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种创新的多模态语言模型,通过结合化学语言和物理化学特征来预测分子性质。该模型采用因果多阶段特征选择,优于现有模型如MOLFORMER和图形神经网络,特别是在生物降解性和PFAS毒性估计方面表现出色。此外,该方法还能减少特征空间维度,提高模型性能,为分子性质预测提供新方向。
🎯
关键要点
- 本文介绍了一种新颖的多模态语言模型方法,结合化学语言表征和物理化学特征。
- 该方法使用因果多阶段特征选择,在MOLFORMER生成的分子嵌入向量空间中结合因果特征与物理化学特征。
- 与现有的化学语言模型MOLFORMER和图形神经网络相比,该方法在预测生物降解性和PFAS毒性估计方面表现更优秀。
- 特征选择方法可以在保持或提高模型性能的同时降低Mordred特征空间的维数。
- 该方法为未来的分子性质预测研究开辟了有前景的方向。
➡️