小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

知名越狱专家成功对Claude Fable 5模型进行越狱,绕过其安全机制,获取敏感内容。专家使用经典爆破法和创新方法,如Unicode替代和文本分解,进行多次尝试,批评安全机制限制了合法研究的进展。

AI模型越狱专家成功对Claude Fable 5越狱 使用经典老式爆破法和创新办法组合越狱

蓝点网
蓝点网 · 2026-06-12T01:00:36Z
ChatGPT正在使用年龄预测功能来限制未成年人看到的内容

OpenAI为ChatGPT新增了年龄预测功能,以保护未成年用户,限制他们接触敏感内容。该功能通过分析用户行为和账户信息判断年龄,并对18岁以下用户实施额外保护。这一措施是在青少年自杀诉讼和参议院讨论聊天机器人对未成年人的潜在危害后推出的。

ChatGPT正在使用年龄预测功能来限制未成年人看到的内容

The Verge
The Verge · 2026-01-21T10:23:14Z
我们对年龄预测的看法

ChatGPT推出年龄预测功能,通过行为和账户信号识别18岁以下用户,自动应用额外保护措施,减少青少年接触敏感内容。用户可通过自拍验证年龄,家长可自定义青少年体验。该功能将在欧盟推广,旨在提升青少年安全。

我们对年龄预测的看法

OpenAI
OpenAI · 2026-01-20T00:00:00Z
OpenAI的家长控制功能上线了——您需要了解的事项

OpenAI推出了ChatGPT的家长控制功能,允许家长减少敏感内容、关闭聊天记录记忆和设定安静时间。青少年需主动选择加入,家长无法查看其对话。此举旨在提高青少年安全性,回应对AI影响未成年人的关注。

OpenAI的家长控制功能上线了——您需要了解的事项

The Verge
The Verge · 2025-09-29T14:26:39Z
标签数量从 10 万减少到 500 以下:谷歌 AI 如何大幅缩减 LLM 训练数据

谷歌研究院推出了一种新方法,通过主动学习显著减少大语言模型微调所需的数据量,最多可减少10,000倍,同时提升模型质量。该方法专注于标注信息量最大的“边界案例”,提高了标签效率和模型适应性,降低了成本,加快了更新速度,并增强了处理敏感内容的能力。

标签数量从 10 万减少到 500 以下:谷歌 AI 如何大幅缩减 LLM 训练数据

实时互动网
实时互动网 · 2025-08-12T02:26:44Z

本研究提出OBLIVIATE框架,旨在解决大语言模型中敏感或有毒内容的记忆问题。该框架通过提取目标数据和应用定制损失函数,有效去除不当内容,同时保持模型的实用性,实验结果表明其具有较强的鲁棒性。

OBLIVIATE: Robustness and Practicality of Machine Forgetting Techniques in Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-07T00:00:00Z
YouTube正在测试模糊缩略图功能以应对‘成人内容’

YouTube正在测试模糊缩略图功能,以提供更安全的搜索体验。该功能针对包含性主题的搜索结果,部分用户将看到模糊的缩略图,但视频标题和描述仍可见,用户可以选择取消模糊。此测试旨在帮助用户避免意外观看敏感内容。

YouTube正在测试模糊缩略图功能以应对‘成人内容’

The Verge
The Verge · 2025-04-30T18:45:41Z
Discord通过身份证和面部扫描验证部分用户的年龄

Discord正在对部分用户实施年龄验证,要求通过面部或身份证扫描访问敏感内容,此举在英国和澳大利亚进行,以遵守当地法律并保护儿童。未验证用户在接触敏感内容或更改过滤设置时需进行验证,Discord承诺不存储用户提交的信息。

Discord通过身份证和面部扫描验证部分用户的年龄

The Verge
The Verge · 2025-04-17T12:12:00Z

本研究提出了一种创新的低秩适应方法,用于优化大型语言模型中的负偏好,成功去除敏感内容,且在学习稳定性上表现优异。

Atyaephyra for SemEval-2025 Task 4: Low-Rank Negative Preference Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z

Web缓存欺骗是一种漏洞,攻击者通过诱导用户访问恶意URL,使缓存服务器错误存储敏感动态内容,从而获取这些缓存信息。此漏洞源于缓存服务器与源服务器处理请求的差异,了解缓存机制和规则有助于防范此类攻击。

Web缓存欺骗:潜藏的安全陷阱与应对策略

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-03-11T12:06:00Z
小红书账户冻结、封禁及恢复指南

小红书用户可能面临账户冻结或封禁,常见原因包括未实名认证、使用敏感图片和不当评论。解决方法为完成实名认证、选择中立头像和避免敏感内容。如账户被冻结,应联系客户支持并检查违规内容。保持账户安全的建议包括完成实名认证和避免使用VPN。

小红书账户冻结、封禁及恢复指南

人言兑
人言兑 · 2025-01-16T05:10:46Z
居然被 ddos 了

作者遭遇DDoS攻击,发现攻击源自同一IP,尽管拉黑后攻击者仍更换IP继续攻击。通过分析日志确认其为恶意行为,提出用敏感内容回应攻击者以引起运营商关注的建议。

居然被 ddos 了

Mereith's Blog
Mereith's Blog · 2024-11-15T17:07:40Z
Google Messages 正在努力应对当今最烦人的消息垃圾信息

Google Messages 正在加强对垃圾求职和快递信息的过滤,并新增可选的敏感内容警告功能,模糊可能含有裸露图片的内容。18岁以下用户默认启用此功能。同时,Google 还改进了诈骗检测系统,以更有效地识别虚假信息。

Google Messages 正在努力应对当今最烦人的消息垃圾信息

The Verge
The Verge · 2024-10-22T19:06:35Z
X(前身为Twitter)现有新规正式允许成人内容

X(前身为Twitter)更新服务条款,允许用户分享成人内容,但需标记且不在头像或横幅中。用户需调整设置以标记敏感内容,未满18岁者无法查看。新规禁止剥削、非自愿、物化及对未成年人有害的内容。

X(前身为Twitter)现有新规正式允许成人内容

The Verge
The Verge · 2024-06-03T15:41:24Z
OpenAI Sora – 文字转视频模型:输入描述性文字,获得,生成长达一分钟的视频

OpenAI在X发布了文字转视频模型Sora,可以生成60秒的视频,包含详细场景、运动镜头和多个角色。Sora的缺陷是难以准确模拟复杂场景的物理原理,可能混淆左右。Sora会自动检查敏感内容。目前公众无法使用Sora,只有部分人可以使用。

OpenAI Sora – 文字转视频模型:输入描述性文字,获得,生成长达一分钟的视频

小众软件
小众软件 · 2024-02-16T07:35:01Z

谷歌计划改进Android屏幕录制功能,允许用户录制单一应用,并选择录制整个屏幕或单一应用以及是否录制音频。谷歌提醒用户录制时可能会涉及敏感内容,建议用户检查和处理隐私内容。

谷歌将更新屏幕录制功能 允许用户选择仅对某个单一应用进行录制

蓝点网
蓝点网 · 2024-01-18T05:58:45Z
聚焦内容密度,而不是广度

文章讨论了在中国互联网环境下长期保持更新的重要性和避免涉及敏感内容的必要性。作者计划在既定领域内加厚内容,并在知识星球中以专栏形式展示。

聚焦内容密度,而不是广度

joojenZhou 个人网站
joojenZhou 个人网站 · 2023-07-11T14:40:43Z

顶级科技公司禁止员工使用ChatGPT,因为可能会泄露商业机密;OPENAI宣布修改开发者政策,除非客户明确同意,否则不会保留数据,并实施30天的数据保留政策,超过30天的数据会自动清理,但ChatGPT仍会收集数据,用户不应输入敏感内容。

OPENAI宣布不再拿API用户的数据进行模型训练(但不包括ChatGPT)

蓝点网
蓝点网 · 2023-03-02T03:41:22Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码