本研究提出AIDBench基准,评估大型语言模型在匿名文本作者识别中的能力,特别是在匿名评审系统中的隐私风险。实验结果显示,这些模型的识别准确率显著高于随机水平,揭示了新的隐私风险。
完成下面两步后,将自动完成登录并继续当前操作。