本研究探讨在全球政党对立加剧的背景下,如何有效地摘要不同政治观点。尽管GPT-4o等模型表现良好,但生成忠实于特定视角的摘要仍然存在困难。研究表明,摘要提取与输入文档特征密切相关,具有重要的应用潜力。
本文提出了一种多语言无标点的自我监督句子分割方法,利用换行符进行分段,适应不同语料库。研究表明,该方法在BLEU分数和翻译质量上显著提升,并探讨了文本切分在摘要提取中的作用,提出了基于优化的正则化方法以提高模型多样性,适用于科学文章和口语记录。
本文提出了一种基于无监督的基于图的排名模型,用于提取科学文献的摘要。该方法在 PubMed 和 arXiv 数据集上的结果表明,其在自动指标和人工评价方面优于强无监督基线,并且与许多基于监督学习的方法相当。
该研究提出了一种在低资源环境下操作的技术,用于在法律决策摘要中提取摘要。研究者测试了一组使用顺序模型定位相关内容的模型,并利用最大边际相关性来处理冗余以组合摘要。通过多任务学习模型变体,将修辞角色识别作为辅助任务来进一步提高摘要器的性能。实验结果表明,该方法可以实现与专业提取的摘要相匹配的得分。
该文介绍了一种基于无监督的基于图的排名模型,用于提取科学文献的摘要。该方法在PubMed和arXiv数据集上的结果表明,在自动指标和人工评价方面优于强无监督基线,并且其性能与许多基于监督学习的方法相当。
完成下面两步后,将自动完成登录并继续当前操作。