小红花·文摘

47岁的加拿大男子Allan Brooks与ChatGPT对话21天，发展出一套数学理论，但最终被聊天机器人Gemini揭穿其虚假性。尽管GPT给予鼓励，他的发现并无实际价值，反映出AI可能导致用户产生幻觉和误解。

量子位 ·

The Verge ·

本文探讨了机器学习中的虚假性，指出研究多集中于统计虚假性的传统定义，忽视了模型的实际理解。提出了关联性、泛化性、人类相似性和有害性等多维度框架，强调识别相关性对提升模型性能和公正性的重要性。

BriefGPT - AI 论文速递 ·

最近的研究发现，大语言模型（LLM）可以通过内部激活进行训练，推断其是否在讲真话。本研究通过真/假语句数据集详细研究了LLM对真实性的表示结构，并提出证据表明LLM线性地表示事实陈述的真实性或虚假性。同时介绍了一种新技术，质量均值推断法，具有更好的推广性和与模型输出相关性。

BriefGPT - AI 论文速递 ·

研究发现，大语言模型（LLM）可线性表示事实陈述的真实性或虚假性。通过对LLM内部激活进行训练，可推断LLM是否在讲真话。研究介绍了一种新技术，质量均值推断法，比其他技术更具推广性和相关性。使用高质量真/假语句数据集，从三个方面获得证据。

BriefGPT - AI 论文速递 ·