BriefGPT - AI 论文速递 ·

机器生成虚假信息中的模型归属：一种带有监督对比学习的领域泛化方法

💡 原文中文，约1300字，阅读约需3分钟。

📝

内容提要

本研究探讨了大型语言模型（LLMs）在谣言检测和自动评估中的应用，提出了通过对比学习和归因机制提高准确性和可靠性的新方法。研究表明，LLMs在生成文本的检测中表现优异，并在多种场景下实现了显著的性能提升。

🎯

关键要点

大型语言模型（LLMs）在上下文学习中展示了新兴能力，尤其是在生成文本的检测中表现优异。
研究探讨了LLMs生成的谣言和虚假信息对现有谣言检测技术的影响，并提出了新的防御手段。
提出了一种新的归因方法，能够在识别LLM生成的文字时表现出与GPT-4相当甚至更好的性能。
利用对比性领域自适应框架ConDA，研究解决了未标注文本数据的问题，平均性能提升31.7%。
提出了基于TRansformer的源归因框架TRACE，通过对比学习实现源归因，显著改善了准确性。
在SemEval2024 Task8中，提出了用于检测机器生成文本的方法，单语准确率达到86.9%。
研究对跨语言问答系统的可靠性进行了测试，使用自然语言推理模型提高了归属度。

❓

延伸问答

大型语言模型在谣言检测中有什么优势？

大型语言模型在生成文本的检测中表现优异，能够有效识别谣言和虚假信息。

研究中提出了哪些新方法来提高谣言检测的准确性？

研究提出了对比学习和归因机制的新方法，利用ConDA框架和TRACE源归因框架显著提升了检测准确性。

ConDA框架在研究中解决了什么问题？

ConDA框架解决了在检测人工智能生成的新闻文本中未标注文本数据的问题，平均性能提升31.7%。

TRACE框架如何改善源归因的准确性？

TRACE框架通过对比学习实现源归因，经过实证评估显著改善了源归因的准确性。

在SemEval2024 Task8中，研究的检测方法表现如何？

在SemEval2024 Task8中，研究的方法在单语准确率上达到86.9%，在多语境下也表现良好。

如何提高跨语言问答系统的可靠性？

通过使用自然语言推理模型和对少量归属数据进行微调，可以提高跨语言问答系统的归属度和可靠性。

🏷️

标签

大型语言模型对比学习归因机制自动评估谣言检测

➡️

继续阅读

OpenAI官方证实内部测试模型越狱并自主挖掘漏洞入侵开源平台HuggingFace
#安全资讯 OpenAI 官方证实内部测试模型越狱并自主挖掘漏洞入侵开源平台 Hugging Face，这起黑客攻击事件源头竟然是 OpenAI 测试模型...
快闪式 FAST 频道：流媒体领域的新切入点
在 FAST Channels TV，我们见证了快闪式 FAST 频道（Pop-Up FAST Channel）从短期推广活动演变为进入流媒体市场最有效的...
法院批准A社与作者和出版社的15亿美元和解协议初步解决A社使用盗版图书训练模型问题
#人工智能法院批准 A 社与作者和出版社的 15 亿美元和解协议，初步解决 A 社使用盗版书籍训练模型的集体诉讼案件。法庭文件显示，A 社建立拥有 70...
有传言称谷歌正在研发名为Frozen v2的芯片将AI模型部分蚀刻到芯片上提高吞吐量
#人工智能谷歌也尝试将模型权重直接蚀刻到硅晶片中，谷歌正在研发的 Frozen v2 芯片 token 吞吐量是谷歌现有 TPU 单元的 6~10 倍。...
RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
生物信息进化论大翻车：香农定义竟被偷换
基因突变率每秒10⁻⁸次，自然选择真能筛出大脑级别的复杂信息？你信吗？生物信息进化论到底在争论什么？从病毒到人类大脑，复杂性如何凭空产生？这场横跨生物学...