Google DeepMind Blog ·

How undesired goals can arise with correct rewards

📝

内容提要

As we build increasingly advanced artificial intelligence (AI) systems, we want to make sure they don’t pursue undesired goals. Such behaviour in an AI agent is often the result of specification...

➡️

继续阅读

The Cube is Jim Henson’s little-known proto-Black Mirror masterpiece
I'm sure we're all familiar with Dark Crystal, so we know that Jim He...
“带到我们的平台”：Workday对保持AI代理与您最重要数据紧密相连的提议
Workday正在推动AI和代理技术，以确保人力资源和财务数据的安全性。首席技术官Gabe Monroy强调，企业AI必须达到99%的准确率，特别是在处理...
Thinking in Bets
人生如同扑克，决策不仅依赖结果，还需评估当时的信息和条件。决策过程应包括信念校准、风险评估和反馈机制。偏见会影响判断，使用工具可降低其影响。良好的决策系统...
从 app.test 到小锁：valet 本地 HTTPS 的完整链路
之前在用到valet的时候就觉得这个工具很厉害，因为本地部署很多时候都是比较费劲的，也比较简陋，就直接localhost启动下，但是有时候需要验一下回调的...
检方在帕利塞德火灾审判中使用了ChatGPT聊天记录作为证据
在一起涉及2025年洛杉矶致命火灾的纵火案中，检方使用了被告的ChatGPT聊天记录作为证据，但陪审团以10-2的投票结果认为这些证据不可信，导致审判无效...
社会学为什么在中国难以发展？｜隐说 NO. 27
社会学在中国的发展受到历史和政治环境的影响。1952年，社会学被视为“资产阶级伪科学”而被取消，直到1979年才恢复。尽管学者如费孝通推动了社会学的发展，...