小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨大型语言模型(LLMs)在医疗研究中解读试验结果时是否受到误导信息的影响。结果表明,LLMs比人类更容易受到误导,但通过特定提示可以减轻这种影响。

Caught in the Web of Words: Are Large Language Models Influenced by Misleading Information in Medical Literature?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究探讨社交媒体上误导信息传播与个体人格特征的关系,发现具分析和批判性特质的人在讨论中更有效,非对抗性说服策略能够成功纠正误导信息,为干预措施提供了重要见解。

利用人工智能代理进行误导信息的说服性人格建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-15T00:00:00Z

为应对科技驱动的虚假新闻传播,研究团队推出FakeWatch框架,结合传统机器学习与语言模型构建分类模型以检测虚假新闻。研究表明,尽管先进语言模型稍有优势,传统模型在准确性和效率上仍具竞争力。该研究为打击误导信息奠定基础,并公开数据与模型以供验证。

FNDEX:可解释人工智能的假新闻和恶意信息检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

大语言模型如ChatGPT可能被滥用生成误导信息,威胁在线安全和公众信任。研究显示,这些模型生成的信息更难检测且更具欺骗性,可能带来更大危害。文章探讨了应对这些误导信息的影响和对策。

等等,泰诺是对乙酰氨基酚……调查和改善语言模型抵制误导性信息请求的能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

研究表明,通过真假标记数据微调大型语言模型可以提高其在气候信息方面的准确性。结果显示,故意注入虚假信息可能不会影响其他领域的准确性。比较了取消学习、微调和检索增强生成(RAG)的有效性,发现取消学习对处理微妙概念有效。这些发现有助于开发更可靠的语言模型,并强调防止误导攻击的重要性。

一些伪善者:少量示例学习和亚型定义用于检测在线气候变化辩论中的伪善指控

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

气候变化的误导信息是解决人类面临的最严重威胁之一的关键障碍。研究发现,大型语言模型在气候信息方面的准确性较高。取消学习算法、微调和检索增强生成(RAG)在语言模型在气候变化主题上的有效性方面也进行了比较。评估结果显示取消学习算法对微妙的概念性主张可能是有效的。这些研究结果有助于指导更可靠的语言模型的发展,并强调了保护语言模型免受误导攻击的必要性。

生成式揭穿气候误导

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

大语言模型(LLM)的出现具有革命性的影响,研究发现LLM生成的误导信息更难以检测,可能具有更具欺骗性的风格,并造成更大的伤害。对抗LLM的误导信息对信息时代和相应对策有影响。

揭示冒充者:领域内检测人类与机器生成的推文

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

大语言模型(LLM)的出现具有革命性的影响,研究发现LLM生成的误导信息更难以检测,可能具有更具欺骗性的风格,并造成更大的伤害。对抗LLM的误导信息对信息时代和相应对策有影响。

透过人工智能的视角:增强人类对 LLM 生成的假新闻的怀疑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

大语言模型(LLM)的出现具有革命性的影响,研究发现LLM生成的误导信息更难以检测,可能具有更具欺骗性的风格,并造成更大的伤害。对抗LLM时的误导信息对信息时代和相应对策有影响。

检测科学交流中的 LLM 辅助写作:我们已经到达目标了吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-30T00:00:00Z

大语言模型(LLM)滥用对在线安全和公众信任构成严重威胁。研究发现,LLM生成的误导信息更难以检测,具有更具欺骗性的风格,可能造成更大伤害。文章还讨论了对抗LLM时误导信息的影响和对策。

以敌对的令牌对抗,生成一个虚假信息检测数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-09T00:00:00Z

滥用大语言模型(LLM)可能导致生成更具欺骗性的误导信息,对在线安全和公众信任构成严重关注。研究发现,与人类编写的相同语义的误导信息相比,LLM生成的误导信息更难以检测,可能造成更大的伤害。对抗LLM的对策也被讨论。

大型语言模型的虚假信息能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-15T00:00:00Z

研究比较了大语言模型(LLM)生成的误导信息和人类编写的误导信息的危害性。结果表明,LLM 生成的误导信息更难以检测,可能更具欺骗性,造成更大的伤害。此外,研究还讨论了对抗 LLM 时的误导信息在信息时代和相应对策的影响。

了解 LLMs 不知道的内容:一种简单有效的自我检测方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-27T00:00:00Z

本文讨论了大语言模型(LLM)可能被滥用生成误导信息的问题,实证研究发现LLM生成的误导信息比人类编写的更难以检测,可能造成更大的伤害。文章还讨论了对抗LLM时的误导信息在信息时代和相应对策的影响。

LLM 生成的错误信息能被检测出吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-25T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码