本研究针对英语作为第二语言学习者的文本简化问题,提出了一种有效的方法来简化复杂句子,显著提高目标词汇的覆盖率和多样性。
该研究发布了VTechAGP数据集,解决了文本简化和改写中的领域知识不足问题,并提出了动态软提示生成语言模型DSPT5,显示出在语义和结构上优于现有模型。
研究针对金融、医学和历史领域的西班牙语文本简化,创建了专用语料库和简化指南,提供了创新方法和资源,促进信息共享。
文本简化是增加文本可理解性的过程。不同方法在不同读者群体和文本是否经历自动或手动简化时会有差异。智力残疾人的理解问题是最可靠的衡量手段,分析阅读速度则提供了有价值的见解。
该文介绍了BLESS语言模型性能基准,评估了44个模型在三个领域的少样本测试集上的表现,考察了模型的尺寸、架构、预训练方法和可访问性。评估结果显示,最佳的语言模型与最新的文本简化基准相当。该基准还揭示了这些模型执行的常见编辑操作类型,将作为未来文本简化方法和评估指标的资源。
该研究使用大型语言模型提出了一种文本简化方法,并使用人工评估框架 SALSA 进行了评估。结果显示 GPT-3.5 可以比人类更优秀的进行简化但仍存在错误。同时,还提出了一种基于编辑注释的自动评估方法 LENS-SALSA,并报告了良好的初步结果。
通过实证研究,设计和实现了可配置的文本简化流水线,揭示了自动文本简化的优势和处理文化和常识知识的挑战。这是对荷兰语文本简化的第一步,为未来的研究和实践提供了启示。
完成下面两步后,将自动完成登录并继续当前操作。