BriefGPT - AI 论文速递 ·

LoRA 高效地撤销了 Llama 2-Chat 70B 中的安全训练

💡 原文中文，约400字，阅读约需1分钟。

📝

内容提要

研究发现，对大型语言模型进行微调以优化下游应用会引入新的安全风险，即使使用良性数据集也可能降低安全对齐性。需要进一步研究以加强对齐的大型语言模型的自定义微调的安全协议。

🎯

🏷️

Run the Mythos Enhanced Coding Model Locally with llama.cpp and Pi
Run Qwythos-9B-Claude-Mythos-5-1M locally with llama.cpp, connect it to Pi co...
阿里Qoder上线全新安全能力，为每位用户配备一位专属安全工程师
基于超1万肿瘤样本训练，哈佛医学院等提出泛癌症基础模型COMPASS，平均性能优于22种现有方法
COMPASS 首次将这一架构引入癌症转录组分析领域，通过利用免疫相关基因集，并建立：基因（gene）→ 基因集（gene set）→ 概念（concep...
挖洞需谨慎！小米安全中心发布违规通报谴责以漏洞测试为借口进行黑客行为
#安全资讯挖洞需谨慎！小米安全中心发布违规事件处置公告，谴责以漏洞测试为借口进行黑客行为。小米在 6 月 26 日下午检测到一起影响广泛的入侵安全事件，...
161k星标OpenCode被曝安全黑洞：实测远程代码执行漏洞全家桶
OpenCode爆出161k星标却让开发者连夜跑路，你的终端还敢让它裸奔吗？ OpenCode这个号称最火的开源AI编程助手，GitHub星标161k，但...
Peak Design’s modular Field Bracket has a finder tag built-in
I am a very clumsy man. So clumsy, that I have AirTags hanging off practicall...