小红花·文摘 - 小红花技术领袖俱乐部

该研究提出了一种新方法，通过对比学习和语义嵌入技术，减少内容泄漏对作者身份识别的影响。研究表明，分离内容和风格嵌入空间显著提高了作者身份识别的准确性，尤其在挑战性评估中提升了多达10%。

Isolating Authorship from Content Using Semantic Embeddings and Contrastive Learning

BriefGPT - AI 论文速递 ·

本研究提出了StyleDistance方法，解决了样式表示训练中的内容泄漏问题。通过使用大型语言模型生成合成数据集，StyleDistance能够训练出更强的内容独立样式嵌入，实验结果表明其在真实世界基准测试中表现优越。

Style Distance: Enhancing Content-Independent Style Embeddings with Synthetic Parallel Examples

BriefGPT - AI 论文速递 ·