小红花·文摘

研究发现，Chat-GPT语言模型的神经活动拓扑结构对公平性的度量标准有影响。GPT-3.5的句子嵌入可以分解为公平和不公平道德判断对应的两个子流形，表明GPT在训练过程中对公平性有了理解。