💡
原文中文,约9600字,阅读约需23分钟。
📝
内容提要
ChEMBL是一个大型的化学分子数据库,收集了大量化合物的化学、生物学数据。本文介绍了使用ChEMBL的Web API和PostgreSQL将ChEMBL ID转化为SMILES的方法。使用Web API可以通过ChEMBL ID过滤分子并提取其SMILES信息。使用PostgreSQL可以将ChEMBL ID导入数据库并查询对应的SMILES。这些方法都可以方便地将ChEMBL ID转换为其他分子表示。
🎯
关键要点
- ChEMBL是一个大型化学分子数据库,包含化合物的化学和生物学数据。
- ChEMBL ID通常用作化合物的标识,需转换为SMILES或InChI等分子表示。
- 本文介绍了使用ChEMBL Web API和PostgreSQL将ChEMBL ID转化为SMILES的方法。
- 使用ChEMBL Web API可以通过chembl-webresource-client包过滤分子并提取SMILES信息。
- 通过PostgreSQL可以将ChEMBL数据库下载至本地,查询速度更快,适合大批量数据转换。
- 安装PostgreSQL后,需创建数据库并导入ChEMBL数据。
- 通过SQL查询可以将ChEMBL ID与对应的SMILES提取出来。
- 对于大规模转换,查询结果可以导出为CSV文件。
❓
延伸问答
ChEMBL ID是什么?
ChEMBL ID是用于标识化合物的唯一标识符,通常用于从ChEMBL数据库中提取数据。
如何使用ChEMBL Web API将ChEMBL ID转换为SMILES?
可以通过安装chembl-webresource-client包,使用filter方法过滤ChEMBL ID并提取其molecule_structures中的canonical_smiles。
PostgreSQL如何用于批量转换ChEMBL ID为SMILES?
首先下载ChEMBL数据库并导入PostgreSQL,然后通过SQL查询将ChEMBL ID与对应的SMILES提取出来。
使用ChEMBL Web API转换数据的速度如何?
通过Web API转换1000条ChEMBL ID为SMILES大约耗时102秒,适合小规模数据处理。
如何导出查询结果为CSV文件?
可以使用COPY命令将查询结果导出为CSV文件,指定输出路径和格式。
ChEMBL数据库的安装步骤是什么?
安装PostgreSQL后,创建数据库并使用pg_restore命令导入ChEMBL数据。
➡️