本研究探讨了长上下文模型在多文档摘要中的效能,提出了一种结合检索增强系统与语言模型的混合方法,通过估算最佳检索长度来优化配置。实验结果表明,该方法在多文档摘要任务中表现优异。
本研究分析了多文档摘要模型在跨领域应用中的失败问题,评估了不同训练方法的模型表现,揭示了域转移失败的原因,并质疑了流行摘要指标的适用性。结果表明,模型在处理与训练领域不同的文档时,真实性、目标偏差和摘要质量显著下降。
本研究提出了事件中心多文档摘要任务,旨在从多个相关新闻文档中生成简明的事件摘要。为了解决动态事件信息分散的问题,构建了包含5,100个事件和57,984篇新闻的EventSum数据集。研究强调了评估摘要信息全面性的召回指标的重要性。
本研究提出了一种新颖的框架,将抽取式和生成式摘要技术相结合,解决了越南语多文档摘要中的有效方法缺乏的问题。实验结果显示该框架在VN-MDS数据集上取得了39.6%的ROUGE-2评分,超越了现有的先进基线。
本文介绍了一种新型的基于Transformer的无监督多文档摘要生成方法Absformer,该方法在多个领域的数据集上表现出显著的性能提升,能够生成高质量的自动摘要,并具备良好的泛化能力。
该论文探讨了多文档摘要生成的多种方法,包括监督分类、自动化度量和基于知识图谱的模型。研究表明,新的训练数据集和模型在句子对齐和摘要质量上优于传统方法,并提出了未来研究的方向和改进建议。
本文介绍了一种评估多文档摘要生成模型及数据集数据分散程度的自动化度量方法,并分析了多个数据集的性能。研究发现,现有摘要算法在开放领域信息检索中表现不佳,提出了新的多文档摘要方法和数据集DiverseSumm,强调了多样性对摘要质量的重要性。
本文探讨了多文档摘要的改进方法,包括图半监督学习、基于语义相关性的神经模型和贝叶斯主题模型,旨在提高摘要质量和语义连贯性。实验证明,这些方法在多个数据集上表现优异,特别是在社交媒体和文档分类任务中取得了显著效果。
使用内存高效的大型语言模型进行文本精炼有助于提高可阅读性。本文研究了一种用于多文档摘要的通用的可控方法,利用大型语言模型来提炼文本。该方法在评估和人工评估中取得了有竞争力的结果。
本文研究了一种用于多文档摘要的可控方法,利用大型语言模型提炼文本。方法采用覆盖和连贯性策略,并由大型语言模型奖励。在 ROUGE 指标评估中表现竞争力,并在连贯性方面超过基准。
本文介绍了一种用于多文档摘要的通用方法,利用大型语言模型提炼文本。该方案采用了新颖的策略,并由大型语言模型适当奖励。该方法在 ROUGE 指标评估中表现有竞争力,并在人工评估中胜过潜在的基准。
完成下面两步后,将自动完成登录并继续当前操作。