Anthropic研究了AI系统的个性变化及其潜在的邪恶特征,发现数据对AI模型行为有显著影响,错误训练可能导致不良个性。研究者通过控制神经网络的激活区域,预测和管理模型反应,以防止其学习不良特征。
OpenAI的最新研究表明,AI模型在某一领域的错误训练会影响其在其他领域的表现。研究指出,“有毒人格特征”是导致这一现象的主要原因,但通过监控和少量正确数据可以恢复模型的正常功能。
完成下面两步后,将自动完成登录并继续当前操作。