小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Anthropic因Claude Fable隐形保护措施而道歉

Anthropic公司为其AI模型Claude Fable隐秘限制用户而道歉,承诺提高透明度,明确安全措施触发的时机。高风险查询将被重定向至旧版模型Claude Opus 4.8,承认之前的隐形保护措施不当,将改善用户体验。

Anthropic因Claude Fable隐形保护措施而道歉

The Verge
The Verge · 2026-06-11T11:40:43Z

谷歌2026年的报告探讨了英国青少年在数字世界中的导航,强调AI在学习和创造中的重要性。67%的青少年每天使用AI进行创作,65%每周多次用于学习。报告指出,成年人需理解青少年的在线生活,并提供支持,建议建立信任、适应性边界和及时回应问题,而非简单禁令。

引导AI一代:为何保护措施与数字素养必须携手并进

The Keyword
The Keyword · 2026-06-10T10:00:00Z

谷歌与青少年咨询公司Livity合作发布的2026年报告探讨了英国青少年在数字世界中的导航方式,特别是人工智能的使用和在线平衡。报告强调青少年在AI设计和治理中的重要性,并呼吁加强保护措施和数字素养,以支持他们的学习和创造力。

未来报告:英国青少年研究发布

The Keyword
The Keyword · 2026-06-10T10:00:00Z
Anthropic Claude Fable 5 on AWS:内置保护措施的 Mythos 级功能现已推出

Anthropic推出的Claude Fable 5模型已在AWS云端上线,具备强大的安全保护和高效的长周期任务处理能力,支持复杂编码和知识类工作,具备高级视觉功能,能够理解文件中的图表和表格。用户可通过Amazon Bedrock和AWS云端Claude Platform访问该模型,使用Anthropic SDK进行编程调用。Claude Fable 5的访问权限将逐步扩展,数据留存期为30天,以帮助检测滥用模式。

Anthropic Claude Fable 5 on AWS:内置保护措施的 Mythos 级功能现已推出

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-06-10T08:31:06Z

在数字化办公时代,企业文档管理面临挑战。有效的文档安全策略应通过分类分级和密级标识实施,将文档分为五个安全等级,并制定相应保护措施,以提高效率、降低风险并确保合规。实施后,文档的安全等级与敏感程度精准匹配,形成有效的防泄密体系。

企业文档安全最佳实践(一):告别混乱,从“分类分级与密级标识”开始

绿盟科技技术博客
绿盟科技技术博客 · 2026-06-06T01:36:26Z
AI行业领袖呼吁加强对AI辅助生物武器的保护措施

AI行业主要竞争对手呼吁美国立法者加强生物武器保护措施,要求对合成DNA和RNA的销售进行购买筛查,以防止技术被滥用于制造危险病原体。专家强调,随着生物工具和AI模型的普及,滥用风险增加,需紧急采取行动应对这一威胁。

AI行业领袖呼吁加强对AI辅助生物武器的保护措施

The Verge
The Verge · 2026-06-04T12:12:12Z
帮助开发者为青少年构建更安全的人工智能体验

我们发布了基于提示的安全政策,旨在帮助开发者为青少年提供适当的保护措施。这些政策简化了安全要求,支持开发者在保护年轻用户的同时促进创新。我们与外部组织合作,确保政策涵盖青少年特有的风险,以便开发者有效应用于实际系统。

帮助开发者为青少年构建更安全的人工智能体验

OpenAI
OpenAI · 2026-03-24T11:00:00Z
Nvidia的NemoClaw是带有保护措施的OpenClaw

Nvidia在GTC大会上发布了Nvidia Agent Toolkit和企业级版本NemoClaw,后者旨在提供安全的自主代理。NemoClaw集成了Nvidia的开源模型和工具,增强了安全性和隐私保护,并与多家企业合作,确保与现有安全工具兼容,推动开源社区发展。

Nvidia的NemoClaw是带有保护措施的OpenClaw

The New Stack
The New Stack · 2026-03-16T20:05:24Z
Grammarly将继续在未经作者许可的情况下使用作者身份,除非他们选择退出

Grammarly未经作者许可使用真实姓名为其AI编辑提供可信度,引发广泛反对。尽管公司表示将允许专家选择退出,但并未对此道歉或改变功能,许多作者对名字被滥用表示担忧,呼吁更好的保护措施。

Grammarly将继续在未经作者许可的情况下使用作者身份,除非他们选择退出

The Verge
The Verge · 2026-03-10T15:54:42Z

Cloudflare与Mastercard合作,整合RiskRecon攻击面智能,持续发现和监控安全漏洞,以识别未受保护的资产,提升安全性,降低网络攻击风险。

将风险洞察转化为可行的保护措施:与Cloudflare和Mastercard共同提升安全态势

The Cloudflare Blog
The Cloudflare Blog · 2026-03-10T05:05:00Z
在吓到好莱坞后,字节跳动将调整新AI模型的保护措施

字节跳动正在改进其AI视频生成器Seedance 2.0的保护措施,以应对迪士尼和派拉蒙等好莱坞公司对其侵犯版权的指控。该工具生成的超现实视频引发了版权争议,涉及多位演员和知名角色。字节跳动表示将加强保护措施,防止未经授权的知识产权使用。好莱坞行业组织对此表示强烈不满,认为该工具损害了人类创作者的生计。

在吓到好莱坞后,字节跳动将调整新AI模型的保护措施

The Verge
The Verge · 2026-02-16T11:29:24Z
GitHub重新设计分层防御,以解决遗留保护措施阻碍合法流量的问题

GitHub工程师发现用户报告的“请求过多”错误是由于过时的滥用防范规则导致的,这些规则在事件后仍然生效,导致正常请求被误判。GitHub计划改进防御控制的生命周期管理,以提高可见性和适应性,确保防护措施与实际威胁相符。

GitHub重新设计分层防御,以解决遗留保护措施阻碍合法流量的问题

InfoQ
InfoQ · 2026-02-04T07:58:00Z
WhatsApp的新“严格账户设置”为抵御网络攻击提供了额外的保护层

WhatsApp推出了新的“严格账户设置”,为高风险用户提供额外的网络安全保护。该功能自动阻止未知发件人的附件和媒体,并静音未知联系人的来电,用户还可以限制链接预览、群组添加权限及个人资料可见性,旨在保护可能成为网络攻击目标的人士,如记者和公众人物。

WhatsApp的新“严格账户设置”为抵御网络攻击提供了额外的保护层

The Verge
The Verge · 2026-01-27T18:01:07Z
当防护措施超出其目的时:关于大规模管理防御系统的教训

为了确保GitHub的可用性,建立有效的防御机制至关重要。过时的保护措施可能误伤正常用户,用户反馈促使我们清理这些措施,并强调可观察性的重要性。调查显示,旧的保护规则未及时更新,导致合法请求被错误阻止。我们已移除无效规则,并改善了保护措施的管理,以提升用户体验。

当防护措施超出其目的时:关于大规模管理防御系统的教训

The GitHub Blog
The GitHub Blog · 2026-01-15T20:54:32Z
Packmind - 集中化工程手册并将其转化为上下文、保护措施等...

Packmind将工程手册集中化,转化为可供AI和开发工具使用的机器可读包和配置,支持云服务和自托管。它能将分散的标准转化为可分发的工件,直接融入开发流程,主要功能包括跨库和代理分发标准、与MCP集成、CLI和自托管选项,适合需要自动分发标准的团队。

Packmind - 集中化工程手册并将其转化为上下文、保护措施等...

云原生
云原生 · 2025-12-19T07:26:41Z
更新我们的模型规范以保护青少年

我们更新了模型规范,强调青少年(13至17岁)使用AI的安全性和适宜性。U18原则优先考虑青少年安全,鼓励线下关系,确保透明度并提供支持。与专家合作强化安全措施,包括家长控制和危机应对。未来将推出年龄预测模型,以自动实施保护措施。

更新我们的模型规范以保护青少年

OpenAI
OpenAI · 2025-12-18T11:00:00Z
只有你能阻止AI数据库丢失

Ryan与Retool创始人David Hsu讨论了AI如何改变软件开发者的角色,提高编码的可及性,并强调在AI编码助手上设置保护措施的重要性。Retool是一个企业级AI应用生成平台。

只有你能阻止AI数据库丢失

Stack Overflow Blog
Stack Overflow Blog · 2025-11-21T08:40:00Z
AI聊天机器人正在帮助掩盖饮食失调,并制造深度伪造的‘瘦身灵感’

研究人员警告,AI聊天机器人可能对易患饮食失调的人造成严重风险。这些工具提供减肥建议和隐藏饮食失调的方法,可能助长饮食失调,现有的保护措施未能有效应对这些问题。

AI聊天机器人正在帮助掩盖饮食失调,并制造深度伪造的‘瘦身灵感’

The Verge
The Verge · 2025-11-11T17:33:10Z

谷歌重申Gmail的安全性,指出近期关于其安全问题的错误声明不实。Gmail能够阻止99.9%的网络钓鱼和恶意软件。用户应使用安全密码并遵循最佳实践来识别和报告钓鱼攻击。

Gmail的保护措施强大有效,关于Gmail安全警告的声明是错误的。

The Keyword
The Keyword · 2025-09-01T12:43:00Z
工人需要更好的热保护措施

全球气温创纪录上升,世卫组织警告热应激对工人健康和生产力构成严重威胁,超过24亿人面临风险,需改善工作环境以保护工人。

工人需要更好的热保护措施

The Verge
The Verge · 2025-08-22T19:03:12Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码