PSC-CPI: 高效且可泛化的多尺度蛋白质序列 - 结构对比用于化合物 - 蛋白相互作用预测

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究使用IntAct PPI数据库创建了一个远程监督的数据集,利用PPI-BioBERT-x10训练集成的BioBERT模型预测蛋白质对之间的PTMs,并提出了置信度校准的方法进行过滤和人工筛选。通过利用多篇文章进行预测,提高了预测的精度和可靠性。研究探讨了深度学习方法在文本挖掘中的应用和局限性,并强调了在人工筛选过程中置信度校准的重要性。

🎯

关键要点

  • 研究使用IntAct PPI数据库创建远程监督的数据集。
  • 利用PPI-BioBERT-x10训练集成的BioBERT模型预测蛋白质对之间的PTMs。
  • 提出置信度校准的方法进行过滤和人工筛选。
  • 发现置信度校准后仍存在测试数据集外的误差和挑战。
  • 通过多篇文章进行预测,提高预测的精度和可靠性。
  • 探讨深度学习方法在文本挖掘中的应用和局限性。
  • 强调在人工筛选过程中置信度校准的重要性。
➡️

继续阅读