小红花·文摘

该研究提出了一种新方法，将文档级关系抽取分解为关系检测和参数分辨，利用显式语篇建模和模块化自我监督进行改进，特别在生物医学领域表现优越。通过结合远程监督和主动学习，减少了人工标注成本，提高了关系提取的准确性和性能。

增强文档级关系抽取的高效多重监督

BriefGPT - AI 论文速递 ·

本文介绍了一种基于预训练语言模型的命名实体识别框架BOND，采用远程监督和自训练方法，解决高噪声和不完整标签问题。该方法在多个基准数据集上表现优于现有技术，提升了模型的泛化能力和性能。

语言模型的混合专家用于命名实体识别

BriefGPT - AI 论文速递 ·

本文介绍了一种通过远程监督微调预训练模型的数据生成技术，旨在实现用户可控的改写生成器。该技术鼓励模型输出多样性，解决短语改写问题，具有语言普适性，并在英文和中文上进行了实验。研究探讨了上下文学习在生成质量和降低有毒性方面的优势，并提出了基于改写生成的方法以提高对话代理的性能和效率。

我的成为你的：在新闻采访对话中定义、注释和检测上下文相关的同义重述

BriefGPT - AI 论文速递 ·

本研究使用IntAct PPI数据库创建了一个远程监督的数据集，利用PPI-BioBERT-x10训练集成的BioBERT模型预测蛋白质对之间的PTMs，并提出了置信度校准的方法进行过滤和人工筛选。通过利用多篇文章进行预测，提高了预测的精度和可靠性。研究探讨了深度学习方法在文本挖掘中的应用和局限性，并强调了在人工筛选过程中置信度校准的重要性。

PSC-CPI: 高效且可泛化的多尺度蛋白质序列 - 结构对比用于化合物 - 蛋白相互作用预测

BriefGPT - AI 论文速递 ·

该研究使用IntAct PPI数据库创建了一个远程监督的数据集，使用PPI-BioBERT-x10训练集成的BioBERT模型来预测蛋白质对之间的PTMs，并提出了置信度校准的方法。通过使用多篇文章进行预测，提高了预测的精度和可靠性。研究探讨了深度学习方法在文本挖掘中的应用和局限性，并强调了在人工筛选过程中置信度校准的重要性。

利用 PPI 检索进行高效的蛋白质相互作用研究

BriefGPT - AI 论文速递 ·

本文介绍了$k$最近邻增强的关系提取方法$k$NN-RE，通过最近邻搜索训练关系，解决语言复杂性和数据稀疏性问题，简单而有效。实验证明$k$NN-RE是利用远程监督数据进行关系提取的有效方法，在多个数据集上取得最高性能，优于其他模型。

NNOSE: 最近邻职业技能提取

BriefGPT - AI 论文速递 ·