该研究定义了文化适应任务并创建了评估框架,评估了现代LLMs在文化适应方面的表现,分析了它们在跨文化知识连接中的性能,以及可能存在的文化偏见和刻板印象。希望该任务能深入了解LLMs在跨文化情境中的文化理解和创造力。
该文介绍了中国法学硕士综合评估基准,将法律能力分为三个层次,第一阶段评估结果显示存在差距。该基准测试可在URL上找到。
完成下面两步后,将自动完成登录并继续当前操作。