小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Fable 5和Mythos 5仍然被暂停:“现在轮到Anthropic了”

由于美国政府发现Fable 5的漏洞,Anthropic禁用了其新模型。尽管公司声称漏洞不严重,但外界对此表示质疑。亚马逊首席执行官报告了该漏洞,促使政府要求Anthropic加强安全措施。这一事件可能影响未来AI模型的发布和安全测试政策。

Fable 5和Mythos 5仍然被暂停:“现在轮到Anthropic了”

The New Stack
The New Stack · 2026-06-13T21:09:17Z

谷歌与FBI合作,起诉名为“外部企业”的网络犯罪组织,旨在打击利用AI进行的网络诈骗。该组织通过伪造短信和网站欺骗用户,造成数百万美元损失。谷歌提倡立法增强防护,并利用AI工具检测和拦截恶意信息,保护用户安全。

我们如何通过安全措施、立法等手段打击人工智能诈骗

The Keyword
The Keyword · 2026-06-12T09:00:00Z
Anthropic因Claude Fable隐形保护措施而道歉

Anthropic公司为其AI模型Claude Fable隐秘限制用户而道歉,承诺提高透明度,明确安全措施触发的时机。高风险查询将被重定向至旧版模型Claude Opus 4.8,承认之前的隐形保护措施不当,将改善用户体验。

Anthropic因Claude Fable隐形保护措施而道歉

The Verge
The Verge · 2026-06-11T11:40:43Z
Fable 5:安全措施和烧钱速度让用户感到烦恼,但他们表示这款产品仍优于Opus 4.8

Anthropic推出了Fable 5,这是首个可广泛使用的Mythos级模型,具备更强的自主性和记忆能力。尽管用户对其性能评价较高,但对短暂的使用窗口、保守的安全措施和强制的数据保留政策表示担忧。使用费用较高,某些领域的回答受到限制,导致部分用户不满。总体来看,社区对其性能反馈积极。

Fable 5:安全措施和烧钱速度让用户感到烦恼,但他们表示这款产品仍优于Opus 4.8

The New Stack
The New Stack · 2026-06-10T17:11:37Z
Anthropic发布首个神话级模型Claude Fable

Anthropic发布了最新的AI模型Claude Fable 5,称其为最强大的广泛可用模型。该模型在软件工程、知识工作和视觉任务中表现出色,并具备新的安全措施以防止高风险领域的响应。同时,公司还推出了Claude Mythos 5,提供有限访问权限,定价显著高于之前的模型。

Anthropic发布首个神话级模型Claude Fable

The Verge
The Verge · 2026-06-09T17:00:00Z
AI智能体安全四件套:从PII泄露到400美元账单的教训

本文分享了作者在开发AI智能体时的经验,强调了四个安全措施:输入检查、输出检查、成本断路器和工具调用检查。这些措施能有效避免隐私泄露和高额账单,确保AI安全运行。

AI智能体安全四件套:从PII泄露到400美元账单的教训

极道
极道 · 2026-06-05T02:35:00Z
代理身份危机:为何您的安全措施未为人工智能革命做好准备

文章讨论了从传统网络应用向智能代理生态系统的转变,强调这一变化对网络安全模型的影响。AI代理的快速发展使身份管理(IAM)面临挑战,代理身份被视为最脆弱的层面。研究表明,许多企业的IAM解决方案尚未准备好应对这一变化。为确保安全,必须将代理视为非人类身份,并通过授权机制管理其权限,以防止数据泄露和安全漏洞。

代理身份危机:为何您的安全措施未为人工智能革命做好准备

The New Stack
The New Stack · 2026-05-28T12:00:00Z
保护您的 Supabase 项目免受 npm 供应链攻击

近期,Node Package Manager (NPM) 的供应链攻击趋势上升,尤其是通过仿冒包名进行钓鱼攻击。Supabase 正在采取措施加强安全,包括发布安全指南、强化 GitHub Actions 和添加安全提示。建议开发者升级到 pnpm 11,固定版本,禁用不必要的安装脚本,并仔细验证包名,以防止潜在攻击。

保护您的 Supabase 项目免受 npm 供应链攻击

Blog - Supabase
Blog - Supabase · 2026-05-26T07:00:00Z

老牌虚拟光驱软件DAEMON Tools自4月8日起遭黑客攻击,官网版本含后门。用户应使用卡巴斯基进行扫描,避免从第三方下载。开发商已发布新版本以清除后门,但数字签名证书尚未更换。建议用户检查是否感染并采取安全措施。

老牌虚拟光驱软件DAEMON Tools自4月8日就被攻击 官网提供的版本携带后门

蓝点网
蓝点网 · 2026-05-07T04:16:31Z
ChatGPT如何在保护隐私的同时了解世界

ChatGPT不断提升能力,帮助用户完成复杂任务。OpenAI重视用户隐私,采用技术减少个人信息使用,用户可选择是否让对话用于模型训练,并可通过设置管理数据控制。临时聊天功能确保对话不被记录,OpenAI承诺保护用户隐私并持续改进安全措施。

ChatGPT如何在保护隐私的同时了解世界

OpenAI
OpenAI · 2026-05-06T08:00:00Z

用户在GoDaddy注册的27年域名被未经授权转移,尽管采取了锁定和双重验证等安全措施,仍无法找回。GoDaddy客服处理不当,拒绝透露接收方信息,最终客户只能迁移到新域名。在苏珊的帮助下,错误域名被转回。文章批评GoDaddy的内部流程混乱,建议用户选择更可靠的域名注册商。

不要使用GoDaddy注册域名:有用户使用27年的域名被擅自转给其他用户且无法找回

蓝点网
蓝点网 · 2026-04-27T06:49:57Z
从 HTTPS 到 LLM Agent:我们重回数字安全的黑暗时代了吗?

随着AI助手的普及,隐私问题日益严重。LLM Agent在工作流中处理大量敏感数据,存在中间层读取和篡改请求的风险。传统的安全措施如HTTPS无法完全解决这些问题,因此需要增强数据处理的透明度和审计能力。未来应关注在受限环境中处理明文数据的安全性。

从 HTTPS 到 LLM Agent:我们重回数字安全的黑暗时代了吗?

Steins;Lab
Steins;Lab · 2026-04-24T17:00:55Z

通用AI的风险管理仍处于起步阶段,面临科学认知差距、信息不对称、市场失灵和制度协调等挑战。开发者与决策者之间缺乏关键信息,导致决策困难。AI模型的复杂性和不透明性使得风险评估和管理变得困难。尽管已有一些进展,但仍需加强透明度和安全措施,以应对潜在风险。

【公益译文】2026年国际AI安全报告(四)

绿盟科技技术博客
绿盟科技技术博客 · 2026-04-23T01:28:04Z
保护非人类身份:自动撤销、OAuth和范围权限

Cloudflare推出了新的安全措施,包括可扫描的API令牌、OAuth可见性和资源范围的RBAC,以保护非人类身份。这些更新旨在防止凭证泄露、用户冒充和权限提升,确保开发环境的安全。通过与GitHub合作,Cloudflare能够及时检测并撤销泄露的令牌,增强用户对身份管理的控制。

保护非人类身份:自动撤销、OAuth和范围权限

The Cloudflare Blog
The Cloudflare Blog · 2026-04-14T13:00:10Z
对抗性人工智能:理解现代AI系统面临的威胁

对抗性人工智能是现代AI系统的威胁,攻击者利用恶意技术操控AI,导致决策失误和信任危机。主要攻击形式包括数据中毒、规避攻击和模型盗窃,企业需加强安全措施以保护AI系统。

对抗性人工智能:理解现代AI系统面临的威胁

The JetBrains Blog
The JetBrains Blog · 2026-04-07T13:01:09Z

税季来临,网络诈骗增多,尤其是退税相关骗局上升67%。谷歌提供五项保护措施:在Pixel手机上筛选可疑电话、快速核实诈骗信息、识别假网站、关注Gmail警报及了解广告来源。这些工具可增强安全性,确保退税安全。

我们如何帮助您在这个税季避免诈骗

The Keyword
The Keyword · 2026-03-19T16:00:00Z
亚马逊召集工程师召开内部会议,深入讨论与“生成式人工智能”相关的故障

亚马逊因AI辅助的生产变更导致网站和应用多次故障,影响客户购物体验。高管发现AI编码错误是主要原因,计划加强安全措施,要求高级工程师审核初级员工的变更。同时,亚马逊加大基础设施投资,但仍在裁员。

亚马逊召集工程师召开内部会议,深入讨论与“生成式人工智能”相关的故障

The New Stack
The New Stack · 2026-03-10T20:09:55Z
如何自建邮件服务器

本文介绍了如何自建邮件服务器,使用Postfix作为SMTP服务器,并配置DNS、邮件转发、DKIM、SPF和DMARC等安全措施。尽管设置过程复杂,但通过耐心和测试,可以实现稳定的邮件发送功能。

如何自建邮件服务器

miguelgrinberg
miguelgrinberg · 2026-03-06T16:10:41Z

我们向Gavalas先生的家人致以诚挚的慰问。目前正在审查此诉讼中的所有索赔。尽管我们的模型在困难对话中表现良好,但AI模型仍有局限性。Gemini旨在防止暴力和自残,并与专业人士合作建立安全措施。

我们对Gavalas诉讼的声明

The Keyword
The Keyword · 2026-03-04T13:30:00Z
GPT-5.3 Instant 系统卡

GPT-5.3 Instant是GPT-5系列的新成员,响应速度更快,答案更丰富,减少无效信息,确保对话流畅,安全措施与GPT-5.2相似。

GPT-5.3 Instant 系统卡

OpenAI
OpenAI · 2026-03-03T10:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码