基于互动知识转移增强图的基因-代谢物关联预测及其在代谢物生产中的应用
💡
原文中文,约1300字,阅读约需3分钟。
📝
内容提要
本文提出了一种可扩展的文件摄取系统,将数据库和PDF数据整合到生物化学知识图谱(BCKG)中,以加速生化科学发现。研究展示了该系统在碳水化合物酶领域的应用,并提出了多种新算法和模型,用于预测基因、蛋白质相互作用及疾病基因,显著提高了识别能力和数据完整性,为生物医学研究提供了重要参考。
🎯
关键要点
- 提出了一种可扩展的文件摄取系统,将数据库和PDF数据整合到生物化学知识图谱(BCKG)中。
- BCKG是一个全面的知识源,可以查询以检索已知的生物化学事实并生成新的见解。
- 系统在碳水化合物酶领域的应用展示了其加速生化科学发现的能力。
- 提出了一种基于生物知识图谱和交互张量分解的疾病基因预测模型KDGene,显著优于现有算法。
- 利用大型语言模型从科学文献中提取知识,研究蛋白质相互作用和基因调控关系。
- 开发了Know2BIO平台,整合30个数据源,捕捉11个生物医学类别中的复杂关系。
- 提出了一种新方法,通过全基因组测序数据和参考代谢物对未知代谢物进行插补,提升数据完整性。
- 应用逻辑机器学习技术促进基因组规模代谢网络模型的学习与优化。
- 利用异构因果元路径图神经网络预测基因-微生物-疾病关联,解决关联稀疏性问题。
❓
延伸问答
什么是生物化学知识图谱(BCKG)?
生物化学知识图谱(BCKG)是一个全面的知识源,可以查询以检索已知的生物化学事实并生成新的见解。
该研究如何加速生化科学发现?
研究通过将数据库和PDF数据整合到BCKG中,利用先前知识加速生化科学发现。
KDGene模型的优势是什么?
KDGene模型显著优于现有算法,能够识别新的、准确的候选基因,尤其在糖尿病案例分析中表现良好。
Know2BIO平台的功能是什么?
Know2BIO平台整合了30个数据源,捕捉11个生物医学类别中的复杂关系,作为知识图谱表示学习的基准测试。
如何利用全基因组测序数据进行代谢物插补?
通过全基因组测序数据和参考代谢物,结合多视图变分自编码器进行特征提取和代谢组学数据插补。
异构因果元路径图神经网络的应用是什么?
该网络用于预测基因-微生物-疾病关联,并通过提升图的语义和结构解决关联稀疏性问题。
➡️