MolFusion: 分子表示的多模态融合学习 -- 基于多粒度视图
原文中文,约400字,阅读约需1分钟。发表于: 。人工智能通过编码药物分子来预测药物特性,帮助快速筛选候选药物。利用不同来源的分子表示,如 SMILES 和分子图,可以提供互补信息进行分子编码。我们提出了一种多粒度融合方法 MolFusion,该方法利用分子级和原子级编码实现不同分子表示之间的相互对齐,实验结果表明 MolFusion 有效地利用了多模态的互补信息,在不同分类和回归任务中显著提高了性能。
研究人员提出了MolBind框架,利用多模态学习将分子和自然语言描述整合到药物发现中。他们通过对比学习训练多模态编码器,实现了多模态语义对齐。此外,他们构建了高质量的数据集MolBind-M4,包含多种模态的配对数据。MolBind展示了优越的零样本学习性能,能够捕捉多种模态的潜在语义。