PostgreSQL生态系统新增32个扩展,涵盖化学信息学、图算法和数据观察等领域。这些扩展增强了数据库处理复杂数据类型和查询的能力,推动其向应用平台和数据平台转型。新扩展如rdkit、provsql和onesparse等,展示了PostgreSQL在专业领域的深入应用。
加拿大温莎大学研究人员比较了GPT和Llama在化学信息学领域的性能,发现Llama在分子特性和药物-药物相互作用预测任务中表现优于GPT。研究团队推荐使用Llama模型进行分子嵌入,因为它在从SMILES字符串生成分子嵌入方面表现出卓越性能。这项研究为未来改进LLM分子嵌入奠定了基础。
本文提出了一种新的数据增强技术,通过修改分子图的拓扑结构生成具有相同分子连通性索引的增强数据。实验证明,基于重要的分子拓扑特征生成的增强数据可以提高分子性质的预测准确度,为化学信息学研究中的数据增强提供了新的视角。
完成下面两步后,将自动完成登录并继续当前操作。