小红花·文摘 - 小红花技术领袖俱乐部

OpenAI开源以安全为中心的新模型：GPT-OSS-SafeGuard 开发者可以自己设置安全边界

OpenAI开源以安全为中心的新模型：GPT-OSS-SafeGuard 开发者可以自己设置安全边界

蓝点网 ·

介绍 gpt-oss-safeguard

介绍 gpt-oss-safeguard

OpenAI ·

人工智能安全突破：体积减少80%的模型在有害内容检测中达到完全性能

人工智能安全突破：体积减少80%的模型在有害内容检测中达到完全性能

DEV Community ·

本文探讨了机器学习在信任与安全问题中的应用，特别是误信息检测的不足。研究分析了270篇文献，发现数据和代码可用性差，模型泛化效果不佳，并提出了改进建议。同时，讨论了生成式人工智能的双重用途困境及其在安全分类任务中的应用，强调了识别和防护AI生成内容的重要性。

生成式人工智能用户安全研究综述

BriefGPT - AI 论文速递 ·