量子位 ·

曦望发布推理GPU S3：All-in推理的国产GPU，开始算单位Token成本

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

曦望发布了新一代推理GPU芯片启望S3，专注于推理效率和成本，显存容量提升4倍，推理成本下降约90%。同时推出寰望SC3超节点方案，优化推理能力和系统稳定性，推动推理云平台发展，强调降低推理成本的重要性。

🎯

关键要点

曦望发布新一代推理GPU芯片启望S3，专注推理效率和成本。
启望S3显存容量提升4倍，推理成本下降约90%。
曦望选择不追求峰值训练性能，而是专注于推理效率与单位成本。
启望S3支持多精度灵活切换，最大化低精度推理效率。
S3采用LPDDR6显存方案，缓解显存瓶颈。
推出寰望SC3超节点方案，提升推理系统稳定性与利用率。
寰望SC3支持全液冷设计，降低系统交付成本。
曦望构建与CUDA兼容的软件体系，降低推理应用迁移门槛。
曦望与生态伙伴探索推理云平台，整合算力为统一推理算力池。
推理时代的核心在于持续降低推理成本，掌握AI产业的成本曲线。

🏷️

继续阅读

揭秘闪充建站成本，比亚迪也玩「百亿补贴」！
比亚迪在闪充发布会上介绍了新一代兆瓦闪充技术，计划年底建成两万座充电站，采用“站中站”模式以降低成本。李云飞表示，尽管充电桩成本高，但几百亿的投入对比亚迪...
20250310
作者经历了一次长时间的睡眠，梦见了许多不可能的人和故事。因工作过度感到虚弱，意识到需要休息，决定减少工作时间，以保持创造力和好奇心。
AI客服越智能越坑人？坑了商家、坑客户，咋办？
你是否也在烦恼AI客服只会兜圈子、不给退款、死活不转人工？这期内容拆解AI客服常见套路，教你识别“只会聊天不办事”的系统，并学会更高效地和AI客服沟通。 ...
本周PSC动态（217）| 2026年3月9日
我们召开了简短会议，讨论潜在新核心团队成员的进展，决定在所有人回复后投票。发现PSC过渡中遗漏了一个小步骤，决定制定检查清单。会议时间有限，未讨论太多问题...
派早报：达摩院发布脂肪肝筛查 AI 模型 MAOSS 等
阿里巴巴达摩院与多家医院合作研发的脂肪肝筛查AI模型MAOSS，能够通过CT影像和血清指标精准筛查肝脂肪分期，将高风险患者的检出率提升至52.4%。该研究...
2026 03 10 HackerNews
爱尔兰将在2025年关闭最后一座燃煤电厂，成为欧洲第15个无煤国家。尽管风能和太阳能发展迅速，环保组织仍呼吁加快可再生能源建设和提升电网灵活性。此举为其他...

曦望发布推理GPU S3：All-in推理的国产GPU，开始算单位Token成本

内容提要

关键要点

标签

继续阅读