本文提出了一种优化框架,用于生成信息性和主题连贯性更强的时间线摘要。研究介绍了多种时间线摘要生成方法及评估指标,创建了DiverseSumm数据集以应对多样信息摘要的挑战,并分析了大型语言模型在此任务中的表现。实验结果表明,背景摘要机制和合适的模型在处理复杂事件时效果显著,为多语言新闻摘要任务提供了新思路。
本文探讨了多种神经主题建模方法,包括维基百科标签、嵌入式主题模型(ETM)和基于聚类的主题建模,旨在提高主题模型的准确性和一致性。这些方法在处理复杂文本和生成可解释主题方面表现优异,尤其在文档分类和主题连贯性上优于传统模型。
本研究提出了一种新的对比学习方法,通过将其作为基于梯度的多目标优化问题,实现了平衡ELBO和对比目标的帕累托稳定解。实验证明,该框架在主题连贯性、主题多样性和下游性能方面始终产生更高性能的神经主题模型。
本文介绍了一种基于神经网络的会话自动语音识别模型,使用潜变量模块学习会话角色偏好和主题连贯性,并使用主题模型来预测主题中的单词。实验结果显示,该模型在两个汉语任务上相对字符错误率降低了最多12%。
完成下面两步后,将自动完成登录并继续当前操作。