本研究提出了MRCEval基准,旨在全面评估机器阅读理解(MRC)能力,解决现有数据集仅评估特定方面的问题。研究表明,即使在大型语言模型时代,MRC仍面临重大挑战。
该论文探讨了无摘录机器阅读理解(MRC)的多种策略和模型,包括双向阅读、高亮显示和自我评估。提出的卷积空间注意力(CSA)模型在RACE和SemEval-2018数据集上显著提升了性能。研究分析了MRC数据的词汇歧义和答案准确性,强调未来数据集需评估上下文相关性,并指出现有模型与人类理解能力仍有差距,提出未来研究方向。
本研究提出了一种名为RoBIn的自动化模型,用于评估科学出版物中的偏见风险(RoB)。该模型结合机器阅读理解,通过双任务方法提取证据并进行二分类,ROC AUC达到0.83,显著优于传统机器学习方法。
本文提出了一种基于理解的机器阅读理解模型,结合自然语言推理、多头注意力和多语言学习机制,以解决模型的敏感性和泛化能力问题。研究还分析了大型语言模型在条件问答中的表现,发现微调后的模型在某些任务上超越现有技术,但在抽取性问答中仍面临挑战。强调了评估指标的重要性,并提出了提升模型性能的需求。
本文研究了语言模型的提示优化,提出了MIPRO优化器,能够在六个语言模型中提高12.9%的准确率。通过多级提示调优和动态提示策略,增强了机器阅读理解和分类的准确度,降低了推理成本,加速了学习过程。
本文探讨了通过多视角内容感知索引(MC索引)和改进的文本检索方法来提升长文档问答(DocQA)性能。研究表明,MC索引显著提高了召回率,并能与多种检索器无缝集成。此外,提出了基于Transformer的架构和结构化文本分割的方法,以增强机器阅读理解(MRC)效果。
本文研究了基于transformer的句子嵌入压缩技术,旨在分离语言信号,特别是主谓一致和谓词交替的信息。通过变分自编码器,发现潜在层的离散与连续组成部分能更好地捕捉目标现象。此外,提出了基于结构嵌入的句法树算法框架(SEST),以提高机器阅读理解的性能。研究还分析了不同编码器的句子嵌入效果及其在语义相似性和自然语言推理中的表现。
该研究探讨了通过优化语言模型提示和降低困惑度来提升零-shot学习性能。提出了多级提示调优方法,结合任务和上下文相关提示,显著提高了机器阅读理解能力。同时引入了新度量标准“prompt flatness”,在分类任务中提升了准确性和相关性。研究还评估了基于提示的文本难度,展示了大型语言模型在教育应用中的潜力。
本研究提出了一种分区多模态提示方法(PMPO),通过多个可学习提示增强视觉表示的上下文理解能力。结合手动设计模板和可学习提示,提高了方法的泛化能力,并在新类别概括等任务中验证了其有效性。此外,研究探讨了多级提示调优和并行提示解码方法,显著提升了机器阅读理解和生成速度。
本研究提出了一种基于机器阅读理解的视觉问答(VQA)方法,通过融合视觉和文本特征,解决多模态特征融合问题。实验结果表明,该方法在多个数据集上表现良好,并强调了创建大规模数据集以增强模型稳健性的重要性。同时,研究探讨了不同融合方法对模型性能的影响。
本文提出了一种基于强化学习和词向量的问答框架,能够高效处理长篇文档。该框架结合快速筛选和精读策略,在多个数据集上实现了显著的性能提升。研究还探讨了机器阅读理解、视觉丰富文档的问答技术及长篇视频理解的挑战,并提出了新的数据集和模型,以提高多模态系统的认知能力和处理效率。
该研究探讨了在低资源环境下,模型与提示调节策略在问答系统中的应用。结果表明,良好初始化下的提示调节表现优异,参数共享提升了性能。此外,提出了多级提示调优方法和新框架,显著改善了机器阅读理解和代码审查任务的效果。
该研究提出了一种多任务学习模型,旨在同时提取情感、原因及其对。实验结果表明,该模型在情感-原因对提取任务上优于现有技术,显著提高了性能。研究者通过基于BERT的模型和多轮机器阅读理解框架,不断优化情感原因抽取的准确性和效率。
本文整理了适用于大模型训练调优的热门中文公开数据集,包括数学问题、文本生成、机器阅读理解、对话数据集等。
该研究提出了一种多级提示调优方法来增强机器阅读理解,实验结果表明,该方法相比最先进的方法,平均改进率达到了1.94%。
本文提出了一种使用少量半结构化解释的方法来训练机器阅读理解模型,使用可学习的神经模块和软逻辑来处理语言变化并克服模型覆盖率不足。在SQuAD数据集上,该方法实现了70.14%的F1得分,速度提高了12倍。
完成下面两步后,将自动完成登录并继续当前操作。