本研究评估了12款开源语言模型在不同语言中的真实性,发现英语表现最佳,而其他语言(如巴斯克语)的真实性差异小于预期。研究提出利用机器翻译扩展真实性基准,并强调信息性的重要性。
完成下面两步后,将自动完成登录并继续当前操作。