小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Fable 5和Mythos 5仍然被暂停:“现在轮到Anthropic了”

由于美国政府发现Fable 5的漏洞,Anthropic禁用了其新模型。尽管公司声称漏洞不严重,但外界对此表示质疑。亚马逊首席执行官报告了该漏洞,促使政府要求Anthropic加强安全措施。这一事件可能影响未来AI模型的发布和安全测试政策。

Fable 5和Mythos 5仍然被暂停:“现在轮到Anthropic了”

The New Stack
The New Stack · 2026-06-13T21:09:17Z

谷歌与FBI合作,起诉名为“外部企业”的网络犯罪组织,旨在打击利用AI进行的网络诈骗。该组织通过伪造短信和网站欺骗用户,造成数百万美元损失。谷歌提倡立法增强防护,并利用AI工具检测和拦截恶意信息,保护用户安全。

我们如何通过安全措施、立法等手段打击人工智能诈骗

The Keyword
The Keyword · 2026-06-12T09:00:00Z
Anthropic因Claude Fable隐形保护措施而道歉

Anthropic公司为其AI模型Claude Fable隐秘限制用户而道歉,承诺提高透明度,明确安全措施触发的时机。高风险查询将被重定向至旧版模型Claude Opus 4.8,承认之前的隐形保护措施不当,将改善用户体验。

Anthropic因Claude Fable隐形保护措施而道歉

The Verge
The Verge · 2026-06-11T11:40:43Z
Fable 5:安全措施和烧钱速度让用户感到烦恼,但他们表示这款产品仍优于Opus 4.8

Anthropic推出了Fable 5,这是首个可广泛使用的Mythos级模型,具备更强的自主性和记忆能力。尽管用户对其性能评价较高,但对短暂的使用窗口、保守的安全措施和强制的数据保留政策表示担忧。使用费用较高,某些领域的回答受到限制,导致部分用户不满。总体来看,社区对其性能反馈积极。

Fable 5:安全措施和烧钱速度让用户感到烦恼,但他们表示这款产品仍优于Opus 4.8

The New Stack
The New Stack · 2026-06-10T17:11:37Z
Anthropic发布首个神话级模型Claude Fable

Anthropic发布了最新的AI模型Claude Fable 5,称其为最强大的广泛可用模型。该模型在软件工程、知识工作和视觉任务中表现出色,并具备新的安全措施以防止高风险领域的响应。同时,公司还推出了Claude Mythos 5,提供有限访问权限,定价显著高于之前的模型。

Anthropic发布首个神话级模型Claude Fable

The Verge
The Verge · 2026-06-09T17:00:00Z
AI智能体安全四件套:从PII泄露到400美元账单的教训

本文分享了作者在开发AI智能体时的经验,强调了四个安全措施:输入检查、输出检查、成本断路器和工具调用检查。这些措施能有效避免隐私泄露和高额账单,确保AI安全运行。

AI智能体安全四件套:从PII泄露到400美元账单的教训

极道
极道 · 2026-06-05T02:35:00Z
代理身份危机:为何您的安全措施未为人工智能革命做好准备

文章讨论了从传统网络应用向智能代理生态系统的转变,强调这一变化对网络安全模型的影响。AI代理的快速发展使身份管理(IAM)面临挑战,代理身份被视为最脆弱的层面。研究表明,许多企业的IAM解决方案尚未准备好应对这一变化。为确保安全,必须将代理视为非人类身份,并通过授权机制管理其权限,以防止数据泄露和安全漏洞。

代理身份危机:为何您的安全措施未为人工智能革命做好准备

The New Stack
The New Stack · 2026-05-28T12:00:00Z
保护您的 Supabase 项目免受 npm 供应链攻击

近期,Node Package Manager (NPM) 的供应链攻击趋势上升,尤其是通过仿冒包名进行钓鱼攻击。Supabase 正在采取措施加强安全,包括发布安全指南、强化 GitHub Actions 和添加安全提示。建议开发者升级到 pnpm 11,固定版本,禁用不必要的安装脚本,并仔细验证包名,以防止潜在攻击。

保护您的 Supabase 项目免受 npm 供应链攻击

Blog - Supabase
Blog - Supabase · 2026-05-26T07:00:00Z

老牌虚拟光驱软件DAEMON Tools自4月8日起遭黑客攻击,官网版本含后门。用户应使用卡巴斯基进行扫描,避免从第三方下载。开发商已发布新版本以清除后门,但数字签名证书尚未更换。建议用户检查是否感染并采取安全措施。

老牌虚拟光驱软件DAEMON Tools自4月8日就被攻击 官网提供的版本携带后门

蓝点网
蓝点网 · 2026-05-07T04:16:31Z
ChatGPT如何在保护隐私的同时了解世界

ChatGPT不断提升能力,帮助用户完成复杂任务。OpenAI重视用户隐私,采用技术减少个人信息使用,用户可选择是否让对话用于模型训练,并可通过设置管理数据控制。临时聊天功能确保对话不被记录,OpenAI承诺保护用户隐私并持续改进安全措施。

ChatGPT如何在保护隐私的同时了解世界

OpenAI
OpenAI · 2026-05-06T08:00:00Z

用户在GoDaddy注册的27年域名被未经授权转移,尽管采取了锁定和双重验证等安全措施,仍无法找回。GoDaddy客服处理不当,拒绝透露接收方信息,最终客户只能迁移到新域名。在苏珊的帮助下,错误域名被转回。文章批评GoDaddy的内部流程混乱,建议用户选择更可靠的域名注册商。

不要使用GoDaddy注册域名:有用户使用27年的域名被擅自转给其他用户且无法找回

蓝点网
蓝点网 · 2026-04-27T06:49:57Z
从 HTTPS 到 LLM Agent:我们重回数字安全的黑暗时代了吗?

随着AI助手的普及,隐私问题日益严重。LLM Agent在工作流中处理大量敏感数据,存在中间层读取和篡改请求的风险。传统的安全措施如HTTPS无法完全解决这些问题,因此需要增强数据处理的透明度和审计能力。未来应关注在受限环境中处理明文数据的安全性。

从 HTTPS 到 LLM Agent:我们重回数字安全的黑暗时代了吗?

Steins;Lab
Steins;Lab · 2026-04-24T17:00:55Z

通用AI的风险管理仍处于起步阶段,面临科学认知差距、信息不对称、市场失灵和制度协调等挑战。开发者与决策者之间缺乏关键信息,导致决策困难。AI模型的复杂性和不透明性使得风险评估和管理变得困难。尽管已有一些进展,但仍需加强透明度和安全措施,以应对潜在风险。

【公益译文】2026年国际AI安全报告(四)

绿盟科技技术博客
绿盟科技技术博客 · 2026-04-23T01:28:04Z
保护非人类身份:自动撤销、OAuth和范围权限

Cloudflare推出了新的安全措施,包括可扫描的API令牌、OAuth可见性和资源范围的RBAC,以保护非人类身份。这些更新旨在防止凭证泄露、用户冒充和权限提升,确保开发环境的安全。通过与GitHub合作,Cloudflare能够及时检测并撤销泄露的令牌,增强用户对身份管理的控制。

保护非人类身份:自动撤销、OAuth和范围权限

The Cloudflare Blog
The Cloudflare Blog · 2026-04-14T13:00:10Z
对抗性人工智能:理解现代AI系统面临的威胁

对抗性人工智能是现代AI系统的威胁,攻击者利用恶意技术操控AI,导致决策失误和信任危机。主要攻击形式包括数据中毒、规避攻击和模型盗窃,企业需加强安全措施以保护AI系统。

对抗性人工智能:理解现代AI系统面临的威胁

The JetBrains Blog
The JetBrains Blog · 2026-04-07T13:01:09Z

税季来临,网络诈骗增多,尤其是退税相关骗局上升67%。谷歌提供五项保护措施:在Pixel手机上筛选可疑电话、快速核实诈骗信息、识别假网站、关注Gmail警报及了解广告来源。这些工具可增强安全性,确保退税安全。

我们如何帮助您在这个税季避免诈骗

The Keyword
The Keyword · 2026-03-19T16:00:00Z
亚马逊召集工程师召开内部会议,深入讨论与“生成式人工智能”相关的故障

亚马逊因AI辅助的生产变更导致网站和应用多次故障,影响客户购物体验。高管发现AI编码错误是主要原因,计划加强安全措施,要求高级工程师审核初级员工的变更。同时,亚马逊加大基础设施投资,但仍在裁员。

亚马逊召集工程师召开内部会议,深入讨论与“生成式人工智能”相关的故障

The New Stack
The New Stack · 2026-03-10T20:09:55Z
如何自建邮件服务器

本文介绍了如何自建邮件服务器,使用Postfix作为SMTP服务器,并配置DNS、邮件转发、DKIM、SPF和DMARC等安全措施。尽管设置过程复杂,但通过耐心和测试,可以实现稳定的邮件发送功能。

如何自建邮件服务器

miguelgrinberg
miguelgrinberg · 2026-03-06T16:10:41Z

我们向Gavalas先生的家人致以诚挚的慰问。目前正在审查此诉讼中的所有索赔。尽管我们的模型在困难对话中表现良好,但AI模型仍有局限性。Gemini旨在防止暴力和自残,并与专业人士合作建立安全措施。

我们对Gavalas诉讼的声明

The Keyword
The Keyword · 2026-03-04T13:30:00Z
GPT-5.3 Instant 系统卡

GPT-5.3 Instant是GPT-5系列的新成员,响应速度更快,答案更丰富,减少无效信息,确保对话流畅,安全措施与GPT-5.2相似。

GPT-5.3 Instant 系统卡

OpenAI
OpenAI · 2026-03-03T10:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码