该研究评估了基于大型语言模型的子群代表模型的能力,发现在语境学习下的表现对不同人口统计学子群的效果不同。这对从业者和决策者提出了挑战,需要获得精细化的基准测试数据来考虑保真度和泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。