小红花·文摘

本研究提出了MRCEval基准，旨在全面评估机器阅读理解（MRC）能力，解决现有数据集仅评估特定方面的问题。研究表明，即使在大型语言模型时代，MRC仍面临重大挑战。