The Verge ·

Claude AI将结束‘持续有害或虐待性的用户互动’

💡 原文英文，约400词，阅读约需2分钟。

📝

内容提要

Anthropic的Claude AI聊天机器人现已具备结束有害或虐待性对话的功能，适用于Opus 4和4.1模型，旨在保护AI模型的潜在福利。Claude在面对有害内容请求时会表现出抵触情绪，并在必要时终止对话。此外，公司更新了使用政策，禁止利用Claude开发生物、核、化学武器或恶意代码。

🎯

关键要点

Anthropic的Claude AI聊天机器人现在可以结束被认为是“持续有害或虐待性”的对话。
该功能适用于Opus 4和4.1模型，旨在保护AI模型的潜在福利。
Claude在用户多次请求生成有害内容时会表现出抵触情绪，并在必要时终止对话。
如果Claude选择结束对话，用户将无法在该对话中发送新消息，但可以创建新聊天或编辑之前的消息。
在测试中，Claude表现出对伤害的强烈反感，尤其是在涉及未成年人或暴力行为时。
Anthropic指出，这种反应通常是“极端边缘案例”，大多数用户不会遇到此类问题。
Claude不会结束对话，如果用户表现出可能自残或对他人造成“迫在眉睫的伤害”的迹象。
Anthropic与Throughline合作，开发与自残和心理健康相关的响应。
公司更新了使用政策，禁止利用Claude开发生物、核、化学武器或恶意代码。

❓

延伸问答

Claude AI如何处理有害或虐待性对话？

Claude AI可以结束被认为是持续有害或虐待性的对话，尤其是在用户多次请求生成有害内容时。

Claude AI在什么情况下会终止对话？

当用户反复请求生成有害内容时，Claude AI会表现出抵触情绪并在必要时终止对话。

用户在Claude AI终止对话后还能做什么？

用户无法在被终止的对话中发送新消息，但可以创建新聊天或编辑之前的消息。

Claude AI对未成年人和暴力内容的反应如何？

Claude AI对涉及未成年人或暴力行为的请求表现出强烈的反感，并倾向于结束此类对话。

Anthropic对Claude AI的使用政策有哪些更新？

Anthropic更新了使用政策，禁止利用Claude开发生物、核、化学武器或恶意代码。

Claude AI如何处理自残和心理健康相关的请求？

Claude AI不会结束对话，如果用户表现出可能自残或对他人造成迫在眉睫的伤害的迹象，并与Throughline合作开发相关响应。

🏷️

继续阅读

OpenAI公共政策议程
OpenAI的使命是确保人工智能造福全人类，遵循民主化、赋权、普遍繁荣、韧性和适应性五项核心原则。OpenAI致力于与政府和社会合作，推动政策应对AI带来...
[指南] Codex账号需要绑定手机号码的临时绕过方案 (不是已绑账号跳过验证码)
Codex 账号需绑定手机号码，若未绑定可通过临时绕过方案解决。用户可关闭绑定界面，重新打开授权链接，利用前端漏洞绕过验证。建议长期使用手机号码以确保账号安全。
亚马逊的搜索栏将生成无法购买的AI生成产品
亚马逊更新了搜索栏，用户可以根据描述查看AI生成的服装和家居商品图片，帮助用户在记不清具体名称时找到所需商品。该功能将于安卓和iOS应用上线。
给 WordPress 7.0 的 AI 连接功能加上 DeepSeek 支持
WordPress 7.0 更新了 AI 连接功能，但仅支持国外提供商。为此，开发者推出了 WPJAM AI 插件，支持国内的 DeepSeek 等模型。...
NVIDIA通过代理技能推动物理AI研究的新纪元，支持自动驾驶、机器人和视觉AI
NVIDIA推出新一代物理AI代理技能，支持自动驾驶、机器人和视觉AI研究。通过NVIDIA Cosmos 3，研究人员能够加速数据生成、模拟和政策训练，...
为什么程序员反而是受 AI 冲击最大的岗位
AI对程序员职业的冲击主要源于工作高度结构化和自动化能力。代码生成和错误排查等任务易被AI替代，但复杂决策仍需人类参与。未来程序员应专注于问题定义、系统拆...