💡
原文中文,约4500字,阅读约需11分钟。
📝
内容提要
曦望公司在一年内完成七轮融资,成为国内首家估值超百亿的纯推理GPU独角兽。王湛表示,推理算力需求激增,未来将超越训练算力。新一代推理GPU芯片启望S3旨在将百万Token成本降至一分钱,以满足高频调用和长上下文的需求,推动AI技术普及。
🎯
关键要点
-
曦望公司在一年内完成七轮融资,累计40亿元,成为国内首家估值超百亿的纯推理GPU独角兽。
-
推理算力需求激增,预计到2026年,AI推理计算的需求量将达到训练算力需求的4-5倍。
-
曦望推出新一代推理GPU芯片启望S3,目标是将百万Token的成本降至一分钱。
-
S3芯片在架构上进行了重大革新,专为推理而生,提升了算力效率和降低了成本。
-
曦望的团队规模已达400余人,研发人员占比超80%,核心技术骨干来自多家知名企业。
-
王湛认为,AI底层的基础价值正在迅速上升,未来算力市场将面临供不应求的局面。
-
曦望将目标瞄准互联网大厂,致力于在高标准下开发产品,以满足市场需求。
❓
延伸问答
曦望公司是如何成为国内首家百亿估值的纯推理GPU独角兽的?
曦望公司在一年内完成七轮融资,累计40亿元,迅速提升估值,成为国内首家百亿估值的纯推理GPU独角兽。
推理算力需求为何会激增?
推理算力需求激增是因为AI应用的普及,预计到2026年,推理计算需求将达到训练算力的4-5倍。
启望S3芯片的主要特点是什么?
启望S3芯片专为推理设计,目标是将百万Token成本降至一分钱,并在架构上进行了重大革新,提升算力效率。
曦望公司的团队规模和背景如何?
曦望公司团队规模已达400余人,研发人员占比超80%,核心技术骨干来自多家知名企业,平均行业经验超过15年。
王湛对未来算力市场的看法是什么?
王湛认为未来算力市场将面临供不应求的局面,限制增长的主要是生产工具的不足。
曦望公司如何降低推理成本以推动AI技术普及?
曦望通过技术创新和专注推理,力求大幅降低单位Token成本,以激活海量Agent的使用。
➡️