将化学分子的 ChEMBL ID 转化为 SMILES 的两种方法

将化学分子的 ChEMBL ID 转化为 SMILES 的两种方法

💡 原文中文,约9600字,阅读约需23分钟。
📝

内容提要

ChEMBL是一个大型的化学分子数据库,收集了大量化合物的化学、生物学数据。本文介绍了使用ChEMBL的Web API和PostgreSQL将ChEMBL ID转化为SMILES的方法。使用Web API可以通过ChEMBL ID过滤分子并提取其SMILES信息。使用PostgreSQL可以将ChEMBL ID导入数据库并查询对应的SMILES。这些方法都可以方便地将ChEMBL ID转换为其他分子表示。

🎯

关键要点

  • ChEMBL是一个大型化学分子数据库,包含化合物的化学和生物学数据。
  • ChEMBL ID通常用作化合物的标识,需转换为SMILES或InChI等分子表示。
  • 本文介绍了使用ChEMBL Web API和PostgreSQL将ChEMBL ID转化为SMILES的方法。
  • 使用ChEMBL Web API可以通过chembl-webresource-client包过滤分子并提取SMILES信息。
  • 通过PostgreSQL可以将ChEMBL数据库下载至本地,查询速度更快,适合大批量数据转换。
  • 安装PostgreSQL后,需创建数据库并导入ChEMBL数据。
  • 通过SQL查询可以将ChEMBL ID与对应的SMILES提取出来。
  • 对于大规模转换,查询结果可以导出为CSV文件。

延伸问答

ChEMBL ID是什么?

ChEMBL ID是用于标识化合物的唯一标识符,通常用于从ChEMBL数据库中提取数据。

如何使用ChEMBL Web API将ChEMBL ID转换为SMILES?

可以通过安装chembl-webresource-client包,使用filter方法过滤ChEMBL ID并提取其molecule_structures中的canonical_smiles。

PostgreSQL如何用于批量转换ChEMBL ID为SMILES?

首先下载ChEMBL数据库并导入PostgreSQL,然后通过SQL查询将ChEMBL ID与对应的SMILES提取出来。

使用ChEMBL Web API转换数据的速度如何?

通过Web API转换1000条ChEMBL ID为SMILES大约耗时102秒,适合小规模数据处理。

如何导出查询结果为CSV文件?

可以使用COPY命令将查询结果导出为CSV文件,指定输出路径和格式。

ChEMBL数据库的安装步骤是什么?

安装PostgreSQL后,创建数据库并使用pg_restore命令导入ChEMBL数据。

➡️

继续阅读