小红花·文摘

本研究提出AIDBench基准，评估大型语言模型在匿名文本作者识别中的能力，特别是在匿名评审系统中的隐私风险。实验结果显示，这些模型的识别准确率显著高于随机水平，揭示了新的隐私风险。