本研究提出了PeerQA数据集,包含579个科学文档的问答对,旨在解决评审过程中的问题与回答不足。实验结果表明,去上下文化的方法提升了文档检索性能,为长上下文建模提供了具有挑战性的基准。
本研究提出了一种上下文化评估协议,以解决语言模型评估中上下文缺失的问题。研究表明,上下文显著影响评估结果,揭示了模型在不同上下文中的表现差异。
ColBERTer是一个上下文化的神经检索模型,使用单向量检索、多向量细化和可选词汇匹配组件。通过学习每个文档中的项的唯一整词表示并删除不必要的词表示,减少文档的存储向量数量。ColBERTer提高了检索结果的可解释性和有效性,并具有多任务学习的特点。
本研究探讨了预训练语言模型中面向方面的情感分类所面临的挑战,特别关注上下文化和产生幻觉的问题。引入了CARBD-Ko数据集,用于注释特定方面、方面极性、面向不可知极性和方面强度的句子。提出了一种使用连体网络的新方法来解决双标方面极性的问题。实验结果显示了准确预测双极性的困难,并强调了上下文化情感分析模型的重要性。CARBD-Ko数据集为未来面向层面情感分类的研究提供了宝贵的资源。
完成下面两步后,将自动完成登录并继续当前操作。