小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨大型语言模型(LLMs)在医疗研究中解读试验结果时是否受到误导信息的影响。结果表明,LLMs比人类更容易受到误导,但通过特定提示可以减轻这种影响。

Caught in the Web of Words: Are Large Language Models Influenced by Misleading Information in Medical Literature?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究探讨社交媒体上误导信息传播与个体人格特征的关系,发现具分析和批判性特质的人在讨论中更有效,非对抗性说服策略能够成功纠正误导信息,为干预措施提供了重要见解。

利用人工智能代理进行误导信息的说服性人格建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-15T00:00:00Z
谷歌将在投票结束后再次禁止与选举相关的广告

谷歌计划在11月5日美国总统选举投票结束后再次禁止与选举相关的广告,以减少误导信息的可能性。此政策自2020年首次实施,Meta也将在选举最后一周停止新政治广告。

谷歌将在投票结束后再次禁止与选举相关的广告

The Verge
The Verge · 2024-10-18T10:01:07Z

该研究综述了大型语言模型(LLMs)生成文本的检测技术,强调评估指标和威胁控制的重要性。研究指出,LLMs生成的误导信息更难以检测,可能造成更大危害。提出了LLM-Detector方法,显著提高了文本检测的准确性,并探讨了现有检测器的局限性,呼吁开发专用检测器以应对LLMs的挑战。

学习重写:通用的LLM生成文本检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-08T00:00:00Z

本研究评估了大型语言模型(LLMs)在政治问题上的偏见,发现较大模型倾向于左翼观点,而小模型较为中立。研究强调了对LLMs进行严格评估的重要性,以确保其在社会应用中的公平性。模型在处理政治表态时表现出阿谀奉承倾向,可能放大误导信息,需谨慎使用。

GermanPartiesQA:商用大型语言模型在政治偏见和奉迎方面的基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z

该研究综述了大型语言模型(LLMs)生成文本的检测技术,提出了评估指标和威胁控制方案。研究发现,LLMs生成的假新闻更难被检测,且存在偏见。通过对抗训练和新数据集的引入,提升了检测准确性,并探讨了LLMs在生成误导信息方面的潜在危害,强调了未来研究的挑战与方向。

揭示冒充者:领域内检测人类与机器生成的推文

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

本文探讨了政治极化与Twitter用户报告的假新闻之间的关系,发现极化增加导致假新闻关键词的用户数量上升。研究表明,社交媒体算法倾向于传播误导信息,建议对其实施类似碳税的政策以控制假消息传播,并分析了虚假信息的传播行为、影响及检测方法,提出了未来研究方向。

误导信息并非有关错误事实:边缘内容的制造和消费分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z

大语言模型(LLM)的出现具有革命性的影响,研究发现LLM生成的误导信息更难以检测,可能具有更具欺骗性的风格,并造成更大的伤害。对抗LLM时的误导信息对信息时代和相应对策有影响。

检测科学交流中的 LLM 辅助写作:我们已经到达目标了吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-30T00:00:00Z

大语言模型(LLM)滥用对在线安全和公众信任构成严重威胁。研究发现,LLM生成的误导信息更难以检测,具有更具欺骗性的风格,可能造成更大伤害。文章还讨论了对抗LLM时误导信息的影响和对策。

以敌对的令牌对抗,生成一个虚假信息检测数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-09T00:00:00Z

滥用大语言模型(LLM)可能导致生成更具欺骗性的误导信息,对在线安全和公众信任构成严重关注。研究发现,与人类编写的相同语义的误导信息相比,LLM生成的误导信息更难以检测,可能造成更大的伤害。对抗LLM的对策也被讨论。

大型语言模型的虚假信息能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-15T00:00:00Z

研究比较了大语言模型(LLM)生成的误导信息和人类编写的误导信息的危害性。结果表明,LLM 生成的误导信息更难以检测,可能更具欺骗性,造成更大的伤害。此外,研究还讨论了对抗 LLM 时的误导信息在信息时代和相应对策的影响。

了解 LLMs 不知道的内容:一种简单有效的自我检测方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-27T00:00:00Z

本文讨论了大语言模型(LLM)可能被滥用生成误导信息的问题,实证研究发现LLM生成的误导信息比人类编写的更难以检测,可能造成更大的伤害。文章还讨论了对抗LLM时的误导信息在信息时代和相应对策的影响。

LLM 生成的错误信息能被检测出吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-25T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码