本研究探讨大型语言模型在匿名文本作者识别中的隐私风险,提出AIDBench基准,通过多种数据集提升著作权识别能力,实验结果表明模型识别准确率显著高于随机水平。
本研究评估了通用可解释人工智能技术在作者识别中的应用,并指出仍需进一步工作以提供有效集成到学者工作流程中的工具。
该研究提出了一种基于笔画部分遮罩的预训练任务,用于从未标注的在线手写数据中提取信息丰富的表示。该方法适用于英语和汉语,并通过微调预训练模型实现了作者识别、性别分类和利手性分类等任务。该研究凸显了利用预训练模型的优点。
完成下面两步后,将自动完成登录并继续当前操作。