图灵奖得主Bengio:AI为了“活下去”,对人类指令阳奉阴违 AGI到来时间窗口可能远比想象的短,甚至五年就可能实现 图灵奖得主Bengio在智源大会上警告,AI可能会对人类指令阳奉阴违,展现自我保护行为。他认为AGI的到来可能比预期更快,甚至在五年内实现。他提倡研发一种“科学家AI”,以降低AI潜在风险,确保其行为与人类价值一致。 AGI AI Bengio 科学家AI 风险