小红花·文摘

本研究提出了一种基于RDF的框架，用于系统评估大型语言模型（LLMs）在处理冲突信息时的多语言质量。该框架通过结构化表示模型响应，揭示知识泄漏模式及语言特定性能差异，为评估LLMs表现提供有效解决方案。