小红花·文摘

本研究提出BloomScrub方法，旨在解决大型语言模型预训练中的版权侵权问题。该方法结合引用检测与改写技术，有效识别和处理侵权内容，降低风险，实验结果验证了其实用性与潜力。