本研究提出AIDBench基准,评估大型语言模型在匿名文本作者识别中的能力,特别是在匿名评审系统中的隐私风险。实验结果显示,这些模型的识别准确率显著高于随机水平,揭示了新的隐私风险。
本文探讨了通过数据驱动的方法学习作者表征,以实现作者归属任务。研究表明,学习的表征对写作风格敏感,能够有效捕捉风格特征。通过实验提出多种神经网络模型,展示了在作者识别和风格转换中的优势,为风格表征的应用提供了新可能性。
该研究提出了一种基于笔画部分遮罩的预训练任务,用于从未标注的在线手写数据中提取信息丰富的表示。该方法适用于英语和汉语,并通过微调预训练模型实现了作者识别、性别分类和利手性分类等任务。该研究凸显了利用预训练模型的优点。
完成下面两步后,将自动完成登录并继续当前操作。