量子位 ·

国内首家百亿估值纯推理GPU独角兽诞生！专访曦望联席CEO王湛：谁的推理成本更低谁就是赢家

💡 原文中文，约4500字，阅读约需11分钟。

📝

内容提要

曦望公司在一年内完成七轮融资，成为国内首家估值超百亿的纯推理GPU独角兽。王湛表示，推理算力需求激增，未来将超越训练算力。新一代推理GPU芯片启望S3旨在将百万Token成本降至一分钱，以满足高频调用和长上下文的需求，推动AI技术普及。

🎯

🔎

随着AI技术的快速发展，推理算力的需求正在迅速增长，预计到2026年将达到训练算力的4-5倍。这一变化意味着企业在选择算力时，需更加关注推理能力的成本效益，以适应高频调用和复杂任务的需求。

曦望推出的启望S3芯片在架构上进行了重大革新，专为推理设计，提升了算力效率并降低了成本。其目标是将百万Token的成本降至一分钱，这将极大推动AI技术的普及和应用。

曦望的成功不仅依赖于技术创新，还得益于其强大的团队和组织管理。团队成员来自多家知名企业，具备丰富的行业经验，这为公司的技术研发和市场竞争提供了坚实的基础。

❓

曦望公司在一年内完成七轮融资，累计40亿元，迅速提升估值，成为国内首家百亿估值的纯推理GPU独角兽。

推理算力需求激增是因为AI应用的普及，预计到2026年，推理计算需求将达到训练算力的4-5倍。

启望S3芯片专为推理设计，目标是将百万Token成本降至一分钱，并在架构上进行了重大革新，提升算力效率。

曦望公司团队规模已达400余人，研发人员占比超80%，核心技术骨干来自多家知名企业，平均行业经验超过15年。

王湛认为未来算力市场将面临供不应求的局面，限制增长的主要是生产工具的不足。

曦望通过技术创新和专注推理，力求大幅降低单位Token成本，以激活海量Agent的使用。

🏷️