该研究提出了一种新方法,通过对比学习和语义嵌入技术,减少内容泄漏对作者身份识别的影响。研究表明,分离内容和风格嵌入空间显著提高了作者身份识别的准确性,尤其在挑战性评估中提升了多达10%。
本研究提出了StyleDistance方法,解决了样式表示训练中的内容泄漏问题。通过使用大型语言模型生成合成数据集,StyleDistance能够训练出更强的内容独立样式嵌入,实验结果表明其在真实世界基准测试中表现优越。
完成下面两步后,将自动完成登录并继续当前操作。