基于 K-mer 的蛋白质相互作用预测方法改进:混沌游戏表示法、深度学习和降低表示偏差
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究使用IntAct PPI数据库创建了一个远程监督的数据集,使用PPI-BioBERT-x10训练集成的BioBERT模型来预测蛋白质对之间的PTMs,并提出了置信度校准的方法以对其进行过滤和人工筛选。研究发现,即使进行了置信度校准,也会出现在测试数据集外的误差和挑战。因此,他们利用多篇文章进行预测,从而提高了预测的精度和可靠性。该研究探讨了深度学习方法在文本挖掘中的应用和局限性,并强调了在人工筛选过程中置信度校准的重要性。
🎯
关键要点
-
研究使用IntAct PPI数据库创建远程监督的数据集。
-
使用PPI-BioBERT-x10训练集成的BioBERT模型预测蛋白质对之间的PTMs。
-
提出置信度校准的方法以进行过滤和人工筛选。
-
发现即使进行了置信度校准,仍存在测试数据集外的误差和挑战。
-
通过利用多篇文章进行预测,提高了预测的精度和可靠性。
-
探讨深度学习方法在文本挖掘中的应用和局限性。
-
强调在人工筛选过程中置信度校准的重要性。
➡️