小红花·文摘

本研究提出PARAPHRASUS基准，以解决现有释义检测模型评估过于简化的问题。该基准通过多维度评估，全面反映模型的语义理解能力，揭示传统分类数据集中无法捕捉的权衡关系。