The New Stack ·

开发者现可使用全球最快的AI芯片

💡 原文英文，约1300词，阅读约需5分钟。

📝

内容提要

芯片制造商Cerebras推出了名为Cerebras Inference的AI云服务，声称比常规云提供商快10到20倍。该服务提供了世界上最大最快的AI芯片，性能超过了Nvidia的GPU。开发者可以使用免费的API密钥在平台上构建AI应用程序，但自定义选项有限。该服务提供了Llama 3.1等模型以及未来具有数十亿参数的模型。Cerebras的芯片比Nvidia的GPU要大得多，从而实现更快的性能。该公司还与G42合作，在美国建立AI数据中心。

🎯

关键要点

Cerebras推出了名为Cerebras Inference的AI云服务，声称比常规云提供商快10到20倍。
该服务提供世界上最大最快的AI芯片，性能超过Nvidia的GPU。
Cerebras的WSE-3 AI芯片面积约为46,225mm²，是Nvidia H100 GPU的56倍。
开发者可以使用免费的API密钥在平台上构建AI应用程序，但自定义选项有限。
可用模型包括Llama 3.1及其8亿和70亿参数的变体，未来将推出更多参数的模型。
Cerebras芯片的响应时间为每秒1,842个标记，比微软Azure快20倍。
开发者可以轻松将聊天机器人或其他AI应用程序迁移到Cerebras的推理云服务。
Cerebras的推理服务定价较高，但API是免费的，提供免费和付费层。
Cerebras的AI速度为多模型工作流提供了可能性，开发者可以将其LLM推理与其他模型串联。
Cerebras的芯片在生产中将整个芯片放在一个晶圆上，解决了带宽问题。
尽管Cerebras硬件性能优越，但缺乏成熟的软件生态系统，开发者的支持至关重要。
Cerebras正在与G42合作，在美国建立AI数据中心。

❓

延伸问答

Cerebras Inference的AI云服务有什么特点？

Cerebras Inference声称比常规云提供商快10到20倍，提供世界上最大最快的AI芯片，性能超过Nvidia的GPU。

开发者如何使用Cerebras的AI芯片？

开发者可以使用免费的API密钥在Cerebras平台上构建AI应用程序，但自定义选项有限。

Cerebras的芯片与Nvidia的GPU相比有什么优势？

Cerebras的WSE-3 AI芯片面积约为46,225mm²，是Nvidia H100 GPU的56倍，提供更快的响应时间和更高的性能。

Cerebras Inference的定价策略是怎样的？

Cerebras的推理服务定价较高，但API是免费的，提供免费和付费层，付费层按每百万个标记收费。

Cerebras的AI芯片如何解决带宽问题？

Cerebras将整个芯片放在一个晶圆上，解决了传统GPU之间的带宽瓶颈问题。

Cerebras未来有哪些计划或模型推出？

未来将推出具有405亿参数的Llama 3.1模型和其他大型模型，如Mistral的Large 2。

🏷️

继续阅读

国星宇航与腾讯云签署“星算”计划战略合作协议，携手领航AI云服务新生态
成都国星宇航与腾讯云签署战略合作协议，聚焦“星算”AI云服务，推动技术共创与生态建设，深化云服务与AI技术融合，助力数字经济发展。
[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...
全球首个机器人训练楼盘开盘：30万套中国住宅，机器人拎包入住
大晓机器人与港中文MMLab推出Kairos-Homeworld，这是首个全屋三维生成与物体级交互框架，利用30万套中国住宅户型数据为机器人提供训练环境。...
Snowflake认为它知道究竟是什么在拖慢开发者的进度
Snowflake推出了基于AI的编码代理CoCo，旨在简化企业开发，支持自动化工作流程和应用开发。CoCo与Snowflake的数据平台深度集成，提供多...
20260605的胡言乱语
本文介绍了多种技术工具和方法，包括YAMLResume简历管理工具、终端中的cal命令、Shlink短链接服务、systemd timers替代cron、...
随想 - 20260605
本文介绍了多个技术主题，包括YAML简历管理工具、快速日历命令、MacBook加热技巧、自托管URL缩短器Shlink、将智能手机转为功能手机的体验、sy...