24人团队硬刚英伟达!AMD前高管梦之队出手,新芯片每秒17000个token

💡 原文中文,约2500字,阅读约需6分钟。
📝

内容提要

初创公司Taalas推出新芯片HC1,速度可达每秒17000个token,成本仅为传统芯片的1/10。该芯片通过将模型直接刻在硅片上,提升了性能和效率。团队由AMD前高管组成,专注于AI推理和训练的创新架构。尽管HC1表现优异,但硬编码可能导致过时的风险。

🎯

关键要点

  • 初创公司Taalas推出新芯片HC1,速度可达每秒17000个token,成本仅为传统芯片的1/10。

  • HC1通过将模型直接刻在硅片上,提升了性能和效率,速度快10倍,功耗降至10分之一。

  • HC1采用台积电N6工艺,面积为815mm²,单颗芯片典型功耗仅为250W。

  • HC1借鉴了结构化ASIC芯片理念,通过调整掩模实现低成本快速生产专用AI推理芯片。

  • Taalas团队由AMD前高管组成,专注于AI推理和训练的创新架构。

  • HC1的硬编码可能导致过时的风险,尤其是在快速迭代的大模型环境中。

  • Taalas已筹集2亿美元投资,预计将在春季发布第二代变体HC2,密度更高、速度更快。

延伸问答

Taalas的新芯片HC1有什么特点?

HC1的峰值推理速度高达每秒17000个token,成本仅为传统芯片的1/10,功耗降低至10分之一。

HC1是如何提升性能和效率的?

HC1通过将模型直接刻在硅片上,避免了传统的内存加载,从而实现了速度和效率的显著提升。

Taalas团队的背景是什么?

Taalas团队由AMD前高管组成,包括前集成电路设计总监和技术经理,专注于AI推理和训练的创新架构。

HC1的硬编码有什么潜在风险?

HC1的硬编码可能导致在快速迭代的大模型环境中容易过时,这是其主要风险之一。

Taalas计划在未来推出什么新产品?

Taalas预计将在春季发布第二代变体HC2,密度更高、速度更快。

HC1的功耗和冷却需求如何?

HC1单颗芯片典型功耗仅为250W,多个芯片组合使用时可通过常规空气冷却机架部署。

➡️

继续阅读