本研究提出了一种基于RDF的框架,用于系统评估大型语言模型(LLMs)在处理冲突信息时的多语言质量。该框架通过结构化表示模型响应,揭示知识泄漏模式及语言特定性能差异,为评估LLMs表现提供有效解决方案。
完成下面两步后,将自动完成登录并继续当前操作。