为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下

机器之心 ·

为什么AI数不清Strawberry里有几个 r？Karpathy：我用表情包给你解释一下

💡 原文中文，约2400字，阅读约需6分钟。

📝

内容提要

大模型在处理一些简单的问题上表现不佳，如无法正确数出单词中的某个字母。这是因为大模型在Tokenization（分词）时将单词分为多个token，导致难以准确计数。此外，大模型缺乏认知自我知识，即对自身知识和能力的认知，导致在某些领域表现出色，而在其他领域犯错。解决方案可能包括扩大规模和采用更复杂的方法。

🎯

关键要点

大模型在处理简单问题时表现不佳，如无法正确数出单词中的某个字母。
Tokenization（分词）导致模型难以准确计数，因为单词被分为多个token。
大模型缺乏认知自我知识，无法意识到自身的知识和能力。
模型在某些领域表现出色，而在其他领域犯错，形成参差不齐的智能现象。
Karpathy提出的Jagged Intelligence概念，强调模型智能的参差不齐与人类不同。
解决方案可能包括扩大模型规模和采用更复杂的方法。
Karpathy推荐阅读Llama 3论文，提出让模型只回答它知道的问题的方法。
后训练应使模型知道它知道什么，而不是单纯增加知识。
在生产环境中，模型应只完成擅长的任务，不擅长的任务由人类接手。

❓

延伸问答

为什么大模型在数单词字母时会出错？

大模型在Tokenization时将单词分为多个token，导致无法准确计数。

什么是Jagged Intelligence？

Jagged Intelligence是Karpathy提出的概念，指模型在某些领域表现出色而在其他领域表现不佳的现象。

如何解决大模型的认知自我知识缺乏问题？

解决方案可能包括扩大模型规模和在后训练阶段采用更复杂的方法。

Karpathy推荐的改进方法是什么？

Karpathy推荐阅读Llama 3论文，提出让模型只回答它知道的问题的方法。

大模型在生产环境中应如何应用？

模型应只完成擅长的任务，不擅长的任务由人类接手。

Tokenization在大模型中的作用是什么？

Tokenization将文本分解为多个token，影响模型对字母计数等简单任务的处理。

🏷️

继续阅读

国星宇航与腾讯云签署“星算”计划战略合作协议，携手领航AI云服务新生态
成都国星宇航与腾讯云签署战略合作协议，聚焦“星算”AI云服务，推动技术共创与生态建设，深化云服务与AI技术融合，助力数字经济发展。
Winxvideo AI 二十周年限免：视频压缩、本地AI提升画质、防抖
Winxvideo AI 正在进行二十周年限免活动，用户只需提供邮箱即可获取注册码。该软件集视频增强、图片修复、格式转换等功能于一体，支持超分辨率提升、帧...
WPS笔记正式发布：AI贯穿记录、整理与复用全过程
金山办公于6月5日发布了AI笔记产品WPS笔记，旨在提升个人知识管理。该产品支持语音、图片和文字等多种信息录入方式，强调信息的主动理解与复用。通过多级AI...
垃圾桶里捡零件，弹幕里接需求，B 站有群人在用 AI 野生造产品
胡彦斌利用AI编程开发了粉丝社区App「彦火」，呼吁粉丝参与共创。广西学生JXW从垃圾桶捡镜子制作智能眼镜，获得关注。听障者李朋程开发语训App，帮助听障...
Article Series: Securing the AI Stack: From Model to Production
This series provides your roadmap for the machine age, exploring how to move ...
B站宣布启动AI创造公开赛打造中国版Build in Public
哔哩哔哩于6月5日启动“AI创造公开赛”，旨在鼓励普通用户参与AI产品开发。比赛无年龄、学历限制，用户可通过投币和弹幕参与评选。赛事吸引了60%非专业开发...