灵敏度提高56%,港中文/复旦/耶鲁等联袂提出全新蛋白质同源物检测方法

💡 原文中文,约5100字,阅读约需12分钟。
📝

内容提要

香港中文大学研究团队开发了超快速、高灵敏度的蛋白质同源物检测框架DHR,能够识别隐藏在序列深处的远端同源物。DHR的灵敏度提高超过10%,速度比传统方法快22倍。研究结果发表在Nature Biotechnology上,显示DHR能够构建高质量的多序列比对(MSA)并处理全新数据,为蛋白质结构预测领域带来新希望。

🎯

关键要点

  • 香港中文大学研究团队开发了超快速、高灵敏度的蛋白质同源物检测框架DHR。
  • DHR能够识别隐藏在序列深处的远端同源物,灵敏度提高超过10%。
  • DHR的速度比传统方法快22倍,研究结果发表在Nature Biotechnology上。
  • 蛋白质序列的同源性鉴定是理解蛋白质进化关系、结构特征和功能的重要任务。
  • 传统方法在面对远端同源物时表现不佳,限制了对蛋白质多样性和复杂性的认识。
  • DHR通过双编码器结构和蛋白质语言模型的强大能力,提供了前所未有的速度和灵敏度。
  • DHR在超家族水平上的灵敏度提高了超56%。
  • DHR的编码查询序列和数据库的速度比传统方法快22倍,比HMMER快28700倍。
  • DHR方法的核心思想是将蛋白质序列编码成密集的嵌入向量,有效计算序列间的相似性。
  • DHR能够在大规模数据集上构建高质量的多序列比对(MSA),并在速度和准确性上优于传统方法。
  • 李煜和孙思琦是该研究的主要负责人,致力于机器学习在生物信息学中的应用。
  • 国内科研团队在蛋白质结构预测领域展现出坚韧不拔的探索精神和创新能力。
➡️

继续阅读