小红花·文摘 - 小红花技术领袖俱乐部

本研究探讨了DNA序列表示的挑战，提出了一种基于k-mer的轻量化模型，能够在基因组读取层面进行元基因组分箱，具有更好的可扩展性，适用于真实数据集。

重新审视K-mer配置以实现有效且可扩展的基因组表示学习

BriefGPT - AI 论文速递 ·

本文提出了三个新的音频、歌词和双模MER研究数据集，合称为MERGE，解决了双模音频-歌词系统发展中的数据库匮乏问题。实验结果表明，使用深度神经网络在双模分类任务上取得了79.21％的最佳综合F1分数。

MERGE -- 一种用于静态音乐情感识别的双模态数据集

BriefGPT - AI 论文速递 ·

该研究使用IntAct PPI数据库创建了一个远程监督的数据集，使用PPI-BioBERT-x10训练集成的BioBERT模型来预测蛋白质对之间的PTMs，并提出了置信度校准的方法以对其进行过滤和人工筛选。研究发现，即使进行了置信度校准，也会出现在测试数据集外的误差和挑战。因此，他们利用多篇文章进行预测，从而提高了预测的精度和可靠性。该研究探讨了深度学习方法在文本挖掘中的应用和局限性，并强调了在人工筛选过程中置信度校准的重要性。

基于 K-mer 的蛋白质相互作用预测方法改进：混沌游戏表示法、深度学习和降低表示偏差

BriefGPT - AI 论文速递 ·