小红花·文摘 - 小红花技术领袖俱乐部

本研究探讨大型语言模型在创意评估中的不足，提出一种新方法，通过分析其在“无趣”与“创意”回应时的内部状态差异，提高创意评判的准确性，并证明这些差异能增强生成文本的创意性。

Steering Large Language Models to Evaluate and Enhance Creativity

BriefGPT - AI 论文速递 ·

大型语言模型是否在内部“知道”何时遵循指令？

大型语言模型是否在内部“知道”何时遵循指令？

Apple Machine Learning Research ·

可靠的事实性问答中的幻觉检测

可靠的事实性问答中的幻觉检测

DEV Community ·

本研究以花园路径句子为案例，提出了分析GPT-2内部状态的方法。研究发现，否定标记对动词对象明确的句子的表示影响较小，而对语态造成歧义的明确句子的表示影响更大。同时，分析解码器模型的隐藏状态可以揭示可能会产生花园路径效应的歧义期。

未来视角：从单个隐藏状态预测后续标记

BriefGPT - AI 论文速递 ·