小红花·文摘 - 小红花技术领袖俱乐部

在多语言模型中通过最小对ABX任务区分形式与意义

在多语言模型中通过最小对ABX任务区分形式与意义

Apple Machine Learning Research ·

最近的研究发现，通过对大语言模型（LLM）的内部激活进行训练，可以推断其真实性。本研究详细研究了LLM对真实性的表示结构，并提出证据表明LLM线性地表示事实陈述的真实性或虚假性。同时，介绍了一种新技术，质量均值推断法，具有更好的推广性和与模型输出相关性。

利用局部内在维度表征大型语言模型生成的真实性

BriefGPT - AI 论文速递 ·

该研究探讨了大语言模型（LLM）对真实性的表示结构，提出证据表明语言模型线性地表示事实陈述的真实性或虚假性。同时，介绍了一种新技术，质量均值推断法，具有更好的推广性和更多地与模型输出相关。

真实的几何：大型语言模型在真假数据集表示中的出现线性结构

BriefGPT - AI 论文速递 ·