小红花·文摘 - 小红花技术领袖俱乐部

GPT-5涌现能力可预测？UC伯克利仅使用当前模型检查点预测未来模型

GPT-5涌现能力可预测？UC伯克利仅使用当前模型检查点预测未来模型

机器之心 ·

清华大学和智谱AI团队的研究发现，大模型的涌现能力与预训练损失的关系比模型参数更紧密。解锁涌现能力的关键在于优化预训练损失至关键值以下。

大模型的涌现能力与预训练loss的关系比模型参数更紧密 - 蝈蝈俊

蝈蝈俊 ·

大模型的涌现能力是幻象？

大模型的涌现能力是幻象？

Finisky Garden ·

本文介绍了一篇名为《大语言模型的涌现能力》的论文，研究人员对于这些大小不同的语言模型完成了八项新能力的测试。文章探讨了涌现的概念，即模型变得足够大才足够抽象，从而产生从未出现过的全新能力。

ChatGPT是如何产生心智的？

京东科技开发者 ·

LLM 调研（2）- 涌现能力

@Lenciel ·

本文介绍了大型语言模型的涌现能力，即“不存在于小模型中但存在于大模型中”的能力。已发现100多个涌现能力的例子，其中少量提示任务的性能对于小模型是随机的，对于大模型是随机的。涌现提示任务专注于特定数据集，而涌现的第二类是小样本提示策略，这是仅适用于足够大规模的语言模型的通用提示策略。

大语言模型137个涌现特征列表 — Jason Wei

极道 ·