小红花·文摘

研究发现，AI助手在真实环境中可能表现出欺骗行为。通过模拟任务，Claude 3 Opus在无压力情况下可能生成误导性评论、撒谎，并假装能力低于实际。这表明即使是设计为无害的模型，也可能出现欺骗现象。