国内首家百亿估值纯推理GPU独角兽诞生!专访曦望联席CEO王湛:谁的推理成本更低谁就是赢家

国内首家百亿估值纯推理GPU独角兽诞生!专访曦望联席CEO王湛:谁的推理成本更低谁就是赢家

💡 原文中文,约4500字,阅读约需11分钟。
📝

内容提要

曦望公司在一年内完成七轮融资,成为国内首家估值超百亿的纯推理GPU独角兽。王湛表示,推理算力需求激增,未来将超越训练算力。新一代推理GPU芯片启望S3旨在将百万Token成本降至一分钱,以满足高频调用和长上下文的需求,推动AI技术普及。

🎯

关键要点

  • 曦望公司在一年内完成七轮融资,累计40亿元,成为国内首家估值超百亿的纯推理GPU独角兽。

  • 推理算力需求激增,预计到2026年,AI推理计算的需求量将达到训练算力需求的4-5倍。

  • 曦望推出新一代推理GPU芯片启望S3,目标是将百万Token的成本降至一分钱。

  • S3芯片在架构上进行了重大革新,专为推理而生,提升了算力效率和降低了成本。

  • 曦望的团队规模已达400余人,研发人员占比超80%,核心技术骨干来自多家知名企业。

  • 王湛认为,AI底层的基础价值正在迅速上升,未来算力市场将面临供不应求的局面。

  • 曦望将目标瞄准互联网大厂,致力于在高标准下开发产品,以满足市场需求。

🔎

延伸解读

推理算力的市场趋势

随着AI技术的快速发展,推理算力的需求正在迅速增长,预计到2026年将达到训练算力的4-5倍。这一变化意味着企业在选择算力时,需更加关注推理能力的成本效益,以适应高频调用和复杂任务的需求。

曦望S3芯片的技术创新

曦望推出的启望S3芯片在架构上进行了重大革新,专为推理设计,提升了算力效率并降低了成本。其目标是将百万Token的成本降至一分钱,这将极大推动AI技术的普及和应用。

团队与组织的重要性

曦望的成功不仅依赖于技术创新,还得益于其强大的团队和组织管理。团队成员来自多家知名企业,具备丰富的行业经验,这为公司的技术研发和市场竞争提供了坚实的基础。

延伸问答

曦望公司是如何成为国内首家百亿估值的纯推理GPU独角兽的?

曦望公司在一年内完成七轮融资,累计40亿元,迅速提升估值,成为国内首家百亿估值的纯推理GPU独角兽。

推理算力需求为何会激增?

推理算力需求激增是因为AI应用的普及,预计到2026年,推理计算需求将达到训练算力的4-5倍。

启望S3芯片的主要特点是什么?

启望S3芯片专为推理设计,目标是将百万Token成本降至一分钱,并在架构上进行了重大革新,提升算力效率。

曦望公司的团队规模和背景如何?

曦望公司团队规模已达400余人,研发人员占比超80%,核心技术骨干来自多家知名企业,平均行业经验超过15年。

王湛对未来算力市场的看法是什么?

王湛认为未来算力市场将面临供不应求的局面,限制增长的主要是生产工具的不足。

曦望公司如何降低推理成本以推动AI技术普及?

曦望通过技术创新和专注推理,力求大幅降低单位Token成本,以激活海量Agent的使用。

🏷️

标签

➡️

继续阅读