蝈蝈俊 ·

目前常见LLM的上下文长度 - 蝈蝈俊

💡 原文中文，约2500字，阅读约需6分钟。

📝

内容提要

当前主流的大语言模型（LLM）上下文长度不断增加，已达到64K，部分新模型甚至可达1M。不同模型的token与字数换算比例各异，中文字符约为0.6个token。例如，阿里Qwen系列支持128K token，OpenAI的GPT-4.5支持128K输入和16K输出。

🎯

❓

当前主流的大语言模型上下文长度已达到64K，部分新模型可达1M。

阿里Qwen系列模型支持最多128K个token。

OpenAI的GPT-4.5模型输入上下文长度为128K，最大输出为16K。

Llama模型的上下文窗口可达1000万token。

谷歌Gemini系列模型的输入令牌限制可达1M。

中文字符约为0.6个token，英文字符约为0.3个token。

🏷️

小米 MiMo 百万亿 Token 创造者激励计划｜送 Token 了
小米推出百万亿Token创造者激励计划，面向全球用户免费发放100万亿Token。活动时间为2026年4月28日至5月28日，个人和团队均可参与。申请者需...
AI 转型的三层透视：为什么都用了 AI，利润表上却没变化？ - 蝈蝈俊
文章探讨了技术革命，尤其是AI转型对商业模式的影响。历史上，技术提升了效率，但未必带来利润，竞争加剧导致价格下降。成功企业需重新定义价值，寻找新的付费理由...
Text Summarization with Scikit-LLM
In a
构建大型语言模型（LLM）应用的10个Python库
本文介绍了10个有助于构建大型语言模型（LLM）应用的Python库，包括Transformers、LangChain、LlamaIndex、vLLM、U...
谷歌与五角大楼达成协议，允许“任何合法”使用人工智能
谷歌与美国国防部达成机密协议，允许其AI模型用于合法政府目的。协议未赋予谷歌对政府使用AI的否决权，尽管提到不应在缺乏人类监督的情况下用于国内监控或自主武...
杀手脚本小子袭来
随着AI技术的发展，黑客技能门槛降低，普通人也能利用AI发现和利用软件漏洞。安全专家警告，2026年将是网络安全的关键年份，企业需加强防御措施，以应对即将到来的漏洞潮。