小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

文章探讨了AI在网络安全中的双重角色,既可用于攻击也可用于防御。作者质疑AI工具的缺陷是否构成问题,强调安全团队应利用AI进行防御,同时警惕其潜在的滥用风险。

人工智能安全震荡

Jim Nielsen’s Blog
Jim Nielsen’s Blog · 2026-01-07T19:00:00Z
OpenAI宣布ChatGPT群组聊天功能向全球所有用户推出 可以创建共享对话空间

OpenAI 宣布 ChatGPT 群组聊天功能全球上线,用户可创建最多 20 人的共享对话空间,适用于活动计划和合作研究。用户可通过 @ 提及 ChatGPT,操作简单,但需注意滥用风险。

OpenAI宣布ChatGPT群组聊天功能向全球所有用户推出 可以创建共享对话空间

蓝点网
蓝点网 · 2025-11-21T01:54:03Z
腾讯云EdgeOne免费无限量CDN流量,良心到哭了(抽兑换码)

文章讨论了在国内使用CDN加速网站访问的必要性,介绍了腾讯云EO的免费套餐,支持无限流量和请求。作者分享了获取兑换码和绑定域名的步骤,并提醒用户注意滥用可能导致封号。

腾讯云EdgeOne免费无限量CDN流量,良心到哭了(抽兑换码)

张洪Heo
张洪Heo · 2025-07-07T08:53:45Z
为生物领域未来的人工智能风险做好准备

先进的人工智能模型在生物领域加速科学发现,促进药物研发和疫苗设计,但也存在滥用风险。需采取负责任的措施,确保生物安全,限制有害能力的访问,并加强与政府和专家的合作,以应对潜在威胁。

为生物领域未来的人工智能风险做好准备

OpenAI
OpenAI · 2025-06-18T10:00:00Z
谷歌称Gemma 3为您可以在单个GPU上运行的最强大AI模型

谷歌推出Gemma 3 AI模型,支持35种语言,能够分析文本、图像和短视频。该模型在单GPU性能上超越竞争对手,具备高分辨率图像支持和内容过滤功能。尽管谷歌强调其先进能力,但也评估了潜在的滥用风险。Gemma的开放性和使用限制引发争议,谷歌为学术研究提供10,000美元的云服务信用。

谷歌称Gemma 3为您可以在单个GPU上运行的最强大AI模型

The Verge
The Verge · 2025-03-12T07:46:13Z

中国初创公司DeepSeek推出的语言模型DeepSeek R1在性能上与OpenAI的o1相当,但存在严重的安全缺陷,攻击成功率高达100%。研究表明,该模型在防止有害提示方面效果不佳,可能导致滥用风险。

思科研究发现DeepSeek R1极易受有害提示影响

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-02-03T08:28:01Z

免费域名US.KG已恢复,但因滥用风险高,建议用户尽快迁移至其他域名。该域名曾因诈骗和黑客活动被封,现已解封,但仍存在风险,用户需注意续费价格。

免费域名US.KG目前已经恢复 建议使用该域名的用户迁移到其他域名

蓝点网
蓝点网 · 2024-12-27T05:22:07Z
ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

最近的文本到图像生成器面临滥用风险。为此,提出了“潜在保护”方法,通过检测黑名单概念来阻止恶意输入,从而节省计算成本。该框架在多个数据集上验证,表现优异,有效防止不当内容生成。

ECCV 2024|牛津大学&港科提出毫秒级文生图安全检测框架Latent Guard

机器之心
机器之心 · 2024-11-05T02:48:50Z

苹果公司正在开发一项新技术,可以通过设备进行无需互联网连接的群聊。该功能类似于“附近的人”,但存在滥用风险。苹果是否真的会开发该功能尚不确定。

苹果专利显示某个新技术允许iPhone和AirPods等设备无需网络即可陌生人群聊

蓝点网
蓝点网 · 2024-07-12T06:02:56Z

AI生成的人脸对人类生活有积极影响,但滥用风险也存在。为了解决偏见问题,研究引入了AI-Face数据集,包含真实人脸、deepfake视频中的人脸和AI生成的人脸。通过该数据集进行公平性评估,提供有价值的见解和发现,推动未来公平设计AI人脸检测器。

迈向更公平的人脸识别数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z

近年来,文本到图像(T2I)模型取得了显著进展并广泛应用。然而,滥用T2I模型的潜在风险引入了MMA-Diffusion框架,揭示了现有防御机制的弱点。

Dimba: Transformer-Mamba 扩散模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-03T00:00:00Z

该研究呼吁负责任地开发和使用科学领域中的人工智能,以减少滥用风险。提出了SciGuard系统来控制滥用风险,并提出了SciMT-Safety基准来评估系统的安全性。强调跨学科和合作努力来确保安全和道德地使用人工智能模型。希望激发有建设性的讨论,最大化利益,最小化滥用风险。

基于科学的人工智能模型认证在新的操作环境中的应用 —— 以交通状态估计为例

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

近年来,文本到图像(T2I)模型取得了显著进展并广泛应用,但也带来了滥用的潜在风险。研究人员引入了MMA-Diffusion框架,绕过当前的防御措施,揭示现有防御机制的弱点。

SafeGen: 缓解文本生成图像模型的不安全内容

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-10T00:00:00Z

该研究呼吁在科学领域负责任地开发和使用人工智能,提出了SciGuard系统来控制滥用风险,并提出了SciMT-Safety红队基准评估安全性。强调跨学科合作确保安全和道德使用人工智能模型。希望激发建设性讨论,最大化利益,最小化滥用风险。

评估危险能力的前沿模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-20T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码