国内首家百亿估值纯推理GPU独角兽诞生!专访曦望联席CEO王湛:谁的推理成本更低谁就是赢家

国内首家百亿估值纯推理GPU独角兽诞生!专访曦望联席CEO王湛:谁的推理成本更低谁就是赢家

💡 原文中文,约4500字,阅读约需11分钟。
📝

内容提要

曦望公司在一年内完成七轮融资,成为国内首家估值超百亿的纯推理GPU独角兽。王湛表示,推理算力需求激增,未来将超越训练算力。新一代推理GPU芯片启望S3旨在将百万Token成本降至一分钱,以满足高频调用和长上下文的需求,推动AI技术普及。

🎯

关键要点

  • 曦望公司在一年内完成七轮融资,累计40亿元,成为国内首家估值超百亿的纯推理GPU独角兽。

  • 推理算力需求激增,预计到2026年,AI推理计算的需求量将达到训练算力需求的4-5倍。

  • 曦望推出新一代推理GPU芯片启望S3,目标是将百万Token的成本降至一分钱。

  • S3芯片在架构上进行了重大革新,专为推理而生,提升了算力效率和降低了成本。

  • 曦望的团队规模已达400余人,研发人员占比超80%,核心技术骨干来自多家知名企业。

  • 王湛认为,AI底层的基础价值正在迅速上升,未来算力市场将面临供不应求的局面。

  • 曦望将目标瞄准互联网大厂,致力于在高标准下开发产品,以满足市场需求。

延伸问答

曦望公司是如何成为国内首家百亿估值的纯推理GPU独角兽的?

曦望公司在一年内完成七轮融资,累计40亿元,迅速提升估值,成为国内首家百亿估值的纯推理GPU独角兽。

推理算力需求为何会激增?

推理算力需求激增是因为AI应用的普及,预计到2026年,推理计算需求将达到训练算力的4-5倍。

启望S3芯片的主要特点是什么?

启望S3芯片专为推理设计,目标是将百万Token成本降至一分钱,并在架构上进行了重大革新,提升算力效率。

曦望公司的团队规模和背景如何?

曦望公司团队规模已达400余人,研发人员占比超80%,核心技术骨干来自多家知名企业,平均行业经验超过15年。

王湛对未来算力市场的看法是什么?

王湛认为未来算力市场将面临供不应求的局面,限制增长的主要是生产工具的不足。

曦望公司如何降低推理成本以推动AI技术普及?

曦望通过技术创新和专注推理,力求大幅降低单位Token成本,以激活海量Agent的使用。

➡️

继续阅读