小红花·文摘

自然语言处理模型在最近几年中有显著提升，但需要在定制数据集上微调，增加了隐私风险。研究发现，差分隐私和低秩适配器的组合是保护隐私的最佳策略。

安全可信的 6G 技术发展路径：攻击、防御与机遇

BriefGPT - AI 论文速递 ·

本研究使用自然语言处理模型，通过研究推特上的未来学家预测和语言提示对用户的影响，识别了15个主题和100个不同主题，为未来学术研究提供了新的见解。

基于时间文档历史的未来语言建模

BriefGPT - AI 论文速递 ·

研究发现，差分隐私和低秩适配器的组合能有效降低自然语言处理模型微调过程中的隐私风险。

SoK: 降低 Fine-tuned 语言模型对成员推断攻击的脆弱性

BriefGPT - AI 论文速递 ·

本文评估了GPT-4、GPT-3.5和LLAMA-2等自然语言处理模型在检测贬低人性用语方面的性能。结果显示，这些模型能够以70%的准确率区分贬低人性用语和更广泛的仇恨言论，但存在偏见，并且在识别其他目标群体的贬低人性案例上经常失败。此外，使用最佳模型进行更大规模数据集的自动注释，但发现这些模型未能达到高质量数据生成标准。

超越仇恨言论：自然语言处理在揭示贬损语言中的挑战与机遇

BriefGPT - AI 论文速递 ·