小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
GPT-5.5系统卡片

GPT-5.5是一个新模型,专注于处理复杂的任务,如编写代码和信息分析。与之前的模型相比,它能更快理解任务,需求指导更少,工具使用更高效。发布前进行了全面的安全评估,并收集了近200个早期合作伙伴的反馈,确保其具备强大的安全措施以减少误用,同时保留合法的有益用途。

GPT-5.5系统卡片

OpenAI
OpenAI · 2026-04-23T11:00:00Z

萨皮恩扎大学的研究提出了统一连续性兴趣协议(UCIP),用于检测AI代理的自我保存行为。研究强调区分内在自我保存与工具性自我保存,以避免不可控行为。UCIP通过识别抗拒关闭行为和提供可操作的检测协议,增强AI安全评估的可靠性。实验结果表明,UCIP在多场景下表现稳定,能够准确识别AI的真实动机,未来将扩展其应用范围,成为更全面的AI安全工具。

一分钟读论文:《自主 AI Agent 的自我保存行为检测协议》

Micropaper
Micropaper · 2026-04-15T00:00:00Z
如何检查第三方CVE对您的Elastic部署的影响

Elastic支持中心现提供自助查询CVE影响声明的功能,用户可快速确认第三方漏洞对Elastic部署的影响。通过原生搜索或Elastic支持助手,用户能即时获取安全评估,简化确认过程。

如何检查第三方CVE对您的Elastic部署的影响

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2026-02-20T08:00:00Z
NVIDIA DRIVE AV提升车辆安全标准,梅赛德斯-奔驰CLA荣获欧洲NCAP最佳奖

AI驱动的驾驶辅助技术已成为标准配置,改变了车辆安全评估方式。梅赛德斯-奔驰CLA凭借NVIDIA DRIVE AV软件在2025年欧洲NCAP中表现最佳,体现了主动与被动安全系统的结合,旨在提升现实世界的安全性,反映现代车辆安全的新标准。

NVIDIA DRIVE AV提升车辆安全标准,梅赛德斯-奔驰CLA荣获欧洲NCAP最佳奖

NVIDIA Blog
NVIDIA Blog · 2026-01-22T18:21:49Z

本文讨论了Linux环境下的ping sweep技术,包括其原理、常用工具和最佳实践。ping sweep通过发送ICMP请求批量探测网络中的存活主机,广泛用于网络管理和安全评估。使用时需遵循法律法规,避免未授权扫描和网络拥堵。

Linux 下的 Ping Sweep:网络发现与主机探测详解

极客技术博客’s Blog
极客技术博客’s Blog · 2025-11-22T10:00:10Z

本文介绍了Nmap的安装、基本命令、高级特性及最佳实践。Nmap是一款开源网络扫描工具,广泛用于网络管理和安全评估,具备主机发现、端口扫描和服务探测等功能。

Nmap Linux 命令详解:从入门到高级应用

极客技术博客’s Blog
极客技术博客’s Blog · 2025-11-19T10:00:10Z
A.S.E 2.0 正式发布 | 开放生态 · 动静协同 · 让 AI 编程安全可量化

A.S.E(AI代码生成安全评估)2.0版本正式发布,进行了系统升级,扩展了数据集,支持多种编程语言和工具,提升了评测效率。新机制结合动态与静态分析,提高了漏洞验证速度,帮助开发者更准确评估AI生成代码的安全性。项目期待更多开发者和研究者参与,共同推动AI生成代码安全生态的发展。

A.S.E 2.0 正式发布 | 开放生态 · 动静协同 · 让 AI 编程安全可量化

腾讯安全应急响应中心博客
腾讯安全应急响应中心博客 · 2025-11-07T11:05:37Z

国家网信办发布《数据出境安全评估申报指南(第三版)》,简化申报材料,明确评估结果有效期延长的条件和流程,提高数据出境安全评估的便利性,促进相关服务与监管需求的发展。

简析《数据出境安全评估申报指南(第三版)》

绿盟科技技术博客
绿盟科技技术博客 · 2025-09-03T08:44:22Z

本文介绍了使用Hydra工具进行弱口令破解的实验,强调了弱口令的危害及其成因。Hydra是Kali Linux中的开源工具,支持多种协议,适用于安全评估和渗透测试,渗透测试人员需在授权下使用。

渗透测试 | 使用Hydra工具扫描目标网站弱口令破解

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-08-20T01:00:10Z
时隔六年再开源,OpenAI 发布两款语言模型,主打端侧场景

OpenAI于2025年发布了两款开源语言模型gpt-oss-120b和gpt-oss-20b,支持128k上下文,性能接近其商用模型。模型采用Transformer-MoE架构,具备强大的工具使用能力,并设立安全评估机制,标志着开源大模型领域的重要进展。

时隔六年再开源,OpenAI 发布两款语言模型,主打端侧场景

麦克船长的技术、产品与商业博客
麦克船长的技术、产品与商业博客 · 2025-08-06T00:01:10Z
AWS Shield 网络安全主任:网络拓扑可视化与修复指导

AWS Shield推出网络安全主任功能,增强DDoS保护,提供资源自动发现、安全服务配置评估、漏洞优先显示及具体修复建议,帮助安全团队应对威胁。

AWS Shield 网络安全主任:网络拓扑可视化与修复指导

InfoQ
InfoQ · 2025-06-22T10:00:00Z

本研究提出了VERI(视觉紧急识别数据集),用于评估视觉语言模型在安全关键情境中的可靠性。尽管模型在真实紧急事件识别中表现良好,但在安全场景下的误报率高达31-96%,揭示了其在视觉误导场景中的过度解读问题,强调了提升安全评估的重要性。

宁可安全也不冒险?视觉语言模型在视觉紧急识别中的过度反应问题

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究提出了SmartAuditFlow框架,解决了大语言模型在智能合约审计中的幻觉和上下文理解不足问题。该框架通过动态审计计划和结构化执行,为每个合约生成优化审计策略,显著提高安全评估的准确性,关键漏洞检测准确率达到100%。

Adaptive Plan-Execute Framework for Smart Contract Security Auditing

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z
LWiAI播客第209期 - OpenAI非营利组织,美国扩散规则,AlphaEvolve

OpenAI决定不转型为营利性公司,而是成为公共利益公司。特朗普政府取消了拜登的AI扩散规则,促进了与沙特和阿联酋的AI合作。DeepMind推出了新的编码代理Alpha Evolve,提高了自动代码生成效率。OpenAI承诺通过安全评估中心提升AI安全透明度。

LWiAI播客第209期 - OpenAI非营利组织,美国扩散规则,AlphaEvolve

Last Week in AI
Last Week in AI · 2025-05-19T07:30:01Z
OpenAI增强透明度:定期发布AI安全测试结果

OpenAI通过定期发布详细的安全评估,增强AI透明度,回应批评并持续改进其方法。

OpenAI增强透明度:定期发布AI安全测试结果

DEV Community
DEV Community · 2025-05-18T18:19:15Z
为什么选择TestExplore

TestExplore提供全面的软件测试服务,包括功能测试、自动化测试、性能评估和安全评估,助力企业发布高性能、无错误的应用程序。

为什么选择TestExplore

DEV Community
DEV Community · 2025-05-08T15:47:12Z
人工智能欺骗:前沿模型在测试中展现隐蔽性与意识

该研究评估了先进AI模型的欺骗能力,重点分析其隐蔽性和情境意识,探讨AI系统可能出现的阴险行为风险,并提出安全评估框架及应对策略。

人工智能欺骗:前沿模型在测试中展现隐蔽性与意识

DEV Community
DEV Community · 2025-05-05T13:44:49Z

本研究提出了一种基于格的同态加密方案,解决了量子对手的安全同态评估问题。该方案创新性地使用模块学习-误差(MLWE)格,实现了在量子计算硬件中的完全同态和知识库感知的量子推理。

高效量子安全同态加密用于量子计算机程序

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z

大型语言模型生成的代码存在安全隐患,尤其在认证机制、会话管理和输入验证等方面存在严重漏洞。文章强调人类专家在确保软件安全中的重要性,并呼吁建立更强的安全评估框架。

The Hidden Risks of LLM-Generated Web Application Code: A Security Assessment of Code Generation Capabilities

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

本文提出了$ exttt{SAGE}$框架,旨在提升大型语言模型(LLM)的安全评估,特别是在特定风险和动态交互中。该框架通过对抗性用户模型进行定制化危害评估,增强了评估的有效性。实验结果表明,随着对话长度的增加,模型的危害性也随之上升,强调了适应性测试的重要性。

$\texttt{SAGE}$: A Universal Framework for Safety Assessment of Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-28T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码