研究发现,Chat-GPT语言模型的神经活动拓扑结构对公平性的度量标准有影响。GPT-3.5的句子嵌入可以分解为公平和不公平道德判断对应的两个子流形,表明GPT在训练过程中对公平性有了理解。
完成下面两步后,将自动完成登录并继续当前操作。