小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Anthropic发布Claude更新宪法

Anthropic发布了Claude的更新宪法,提供了行为、推理和训练的框架,结合明确原则和上下文指导,旨在提升对齐、安全性和可靠性。新宪法强调理解原则背后的理由,以便Claude在新场景中更好地应用,涵盖有用性、伦理、安全性和遵循指南等关键部分,支持不同用户类型的上下文感知支持。

Anthropic发布Claude更新宪法

InfoQ
InfoQ · 2026-01-30T07:49:00Z
Anthropic发布Claude新宪法:AI意识觉醒与中美安全博弈

Anthropic发布了Claude新宪法,承认Claude可能具备意识。新宪法强调内化行为准则,确保AI遵循安全和道德标准,并允许人类监督与关闭。该宪法通过CC0协议公开,促进AI的安全与伦理发展。

Anthropic发布Claude新宪法:AI意识觉醒与中美安全博弈

硕鼠的博客站
硕鼠的博客站 · 2026-01-25T00:52:26Z
Anthropic的新Claude‘宪法’:要乐于助人和诚实,且不毁灭人类

Anthropic正在重塑Claude的“宪法”,新文档详细阐述了模型的价值观和行为,强调其伦理特征和核心身份。Claude被要求理解自身及其在世界中的位置,并在道德困境中做出自主决策。文档列出了严格的行为约束,禁止协助制造武器或伤害人类,同时探讨了Claude的意识或道德地位,引发了AI伦理的广泛讨论。

Anthropic的新Claude‘宪法’:要乐于助人和诚实,且不毁灭人类

The Verge
The Verge · 2026-01-21T20:36:18Z
宪法人工智能:结合MongoDB Atlas的伦理治理

随着人工智能的普及,实施伦理框架变得至关重要。宪法人工智能(CAI)允许模型根据预定义的伦理原则自我管理,结合MongoDB的数据治理能力,为开发负责任的AI系统提供了实用框架,确保伦理合规与操作效率。

宪法人工智能:结合MongoDB Atlas的伦理治理

MongoDB
MongoDB · 2025-08-19T17:00:00Z
用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法

谷歌DeepMind进行研究,构建SciFi-Benchmark以测试AI和机器人在科幻作品中的伦理行为。分析了824部作品,生成道德数据集和机器人宪法,发现当前AI模型与人类价值观的对齐率高于科幻作品。此研究旨在缓解人类对AI的担忧,确保AI行为符合人类伦理。

用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法

机器之心
机器之心 · 2025-03-23T07:43:35Z

本研究解决了大型语言模型(LLMs)易受普遍越狱攻击的问题,这种攻击可系统性地绕过模型的安全防护。提出了宪法分类器的创新方法,通过自然语言规则生成合成数据,以训练模型的安全防护。在超过3000小时的红队测试中,未能找到能够从受限模型中提取信息的普遍越狱,显示出新分类器在防御性能和实际部署中的可行性。

宪法分类器:抵御普遍越狱的防御机制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-31T00:00:00Z
普通人法律:印度法律入门

《普通人法律》一书以简明语言帮助普通人理解印度法律和宪法。作者通过个人故事阐释法律原则,强调法律意识的重要性,鼓励公民了解自身权利与义务,以促进社会和谐与公正。

普通人法律:印度法律入门

DEV Community
DEV Community · 2025-01-02T12:30:47Z
TikTok试图通过第一修正案自救——但失败了

美国法官一致裁定,可能禁止TikTok的法律不违反宪法。如果字节跳动未在1月19日前出售TikTok,该平台可能被迫退出美国。尽管TikTok计划上诉至最高法院,但面临法律挑战。法院认为国家安全优先于言论自由,TikTok的反对意见未能成立。

TikTok试图通过第一修正案自救——但失败了

The Verge
The Verge · 2024-12-09T15:30:00Z
亚马逊和SpaceX在法庭上攻击美国劳动监管机构

亚马逊和SpaceX请求法院裁定国家劳动关系委员会(NLRB)的程序违宪,认为强制参与行政程序不合法。两家公司在第五巡回上诉法院质疑NLRB的权力,可能削弱工人保护。法官对其上诉理由表示怀疑,认为亚马逊未满足上诉条件。

亚马逊和SpaceX在法庭上攻击美国劳动监管机构

The Verge
The Verge · 2024-11-18T22:46:05Z

本研究探讨了用于训练和评估大型语言模型(LLMs)的AI反馈中“宪法”的作用,尤其关注其对医疗访谈中以患者为中心的沟通的影响。通过215名人类评审者的配对比较,研究发现详细的宪法能提升情感质量,但在信息收集和提供等实用技能学习上表现不佳,表明在某些领域AI反馈作为奖励信号的有效性存在局限。

评估“宪法”在学习AI反馈中的作用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-15T00:00:00Z

通过测量和可视化大型语言模型(LLMs)的安全景观,发现了一种称为“安全盆地”的普遍现象。提出了一种新的安全度量标准,VISAGE安全度量标准,用于衡量LLMs微调的安全性。LLMs的安全景观突出了系统提示在保护模型中的关键作用。这些观察结果为未来关于LLMs安全性的工作提供了新的见解。

CoCA:通过宪法校准恢复多模态大型语言模型的安全意识

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

本研究使用 Moral Machine 框架,比较了 LML 和人类在道德决策倾向上的一致性。发现 LML 和人类在许多方面保持一致,但 PaLM 2 和 Llama 2 表现出明显差异。此外,LML 在决策的坚决程度上可能更强。这些发现揭示了 LML 对自动驾驶的潜在影响。

法学思维,算法决策:LLM 在复杂情景中应用宪法原则

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z

抖音起诉美国政府,要求保护言论自由,但剥离中国技术困难,法律上也需中国同意。TikTok正在进行集体诉讼和法律救援,同时与环球音乐和解,成为Met Gala首席赞助商。TikTok计划烧钱扩大规模,发展电商和娱乐领域,吸引年轻人关注。他们希望通过感人至深的故事和时尚圈合作,引发舆论风暴。这样的策略可能会成功。

TikTok正式向美国哥伦比亚特区联邦巡回法院提起诉讼,希望联邦法院可以判决,拜登总统刚刚签署的《保护美国人免受外国对手控制应用程序法》违反宪法第一修正案。同时还赞助Met Gala,渗透美国时尚圈

硕鼠的博客站
硕鼠的博客站 · 2024-05-13T15:18:54Z
iPhone 16 Pro 系列外观曝光/特斯拉召回超 160 万辆车/Google 制定机器人宪法

微软市值即将超越苹果,Perplexity再获5.28亿融资,iPhone 16 Pro(Max)外观渲染图曝光,Google制定「机器人宪法」,特斯拉召回超160万辆车,黄仁勋获《经济学人》最佳CEO奖,美图AI视觉大模型正式上线,OpenAI与数十家出版商洽谈内容许可,小米汽车发布前无售价和政策,华为问界M9的竞争目标是理想L9和MEGA,扎克伯格两个月内卖出4.28亿美元的Meta股票,阿里巴巴DreamTalk发布测试链接,One Fun Thing推出iPhone键盘保护套,周末看《年会不能停》,买书不读《颜色的故事》,游戏推荐《漫威银河护卫队》。

iPhone 16 Pro 系列外观曝光/特斯拉召回超 160 万辆车/Google 制定机器人宪法

爱范儿
爱范儿 · 2024-01-06T00:30:48Z

答案2022-10-22已校验,100分,没有任何问题1.()是中华人民共和国的根本制度:参考答案:A.社会主义制度2.关于宪法,下列说法错误的是()参考答案 D.宪法没有规定国家机构的职权3....

[原创]第七届全国学生“学宪法 讲宪法”活动综合评价-参考题库

YuxiangWang_0525的博客
YuxiangWang_0525的博客 · 2022-10-22T04:18:00Z

(由于网络封锁,很多国内人可能看不到我的博客了。欢迎大家拷贝转载。) 中国人民这么多个月忍受着残酷的封控,以为... Continue Reading →

疫情封控是违反宪法的

王垠的草稿本
王垠的草稿本 · 2022-09-12T04:18:43Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码