芯片公司Taalas将AI模型蚀刻到芯片电路中 性能达到惊人的每秒1.7万个Token

芯片公司Taalas将AI模型蚀刻到芯片电路中 性能达到惊人的每秒1.7万个Token

💡 原文中文,约1500字,阅读约需4分钟。
📝

内容提要

加拿大初创公司Taalas将AI模型直接蚀刻到芯片中,性能达到每秒1.7万Tokens。该技术使芯片通电后即为模型,速度极快,但无法升级,需重新流片。Taalas已完成1.69亿美元融资,展示其定制化芯片技术。

🎯

关键要点

  • 加拿大初创公司Taalas将AI模型蚀刻到芯片中,性能达到每秒1.7万Tokens。

  • 该技术使芯片通电后即为模型,速度极快,但无法升级,需重新流片。

  • Taalas已完成1.69亿美元融资,展示其定制化芯片技术。

  • Taalas的技术将大型语言模型的部分结构直接硬编码到硅芯片上。

  • H1C芯片单用户推理速度达到17,000+Tokens/秒,性能显著提升。

  • 该技术类似于90年代的门阵列,利用古老技术接近LLM参数稀疏性和量化带来的复杂性。

  • 芯片设计中,权重和计算结构通过晶体管和金属线蚀刻在硅芯片中。

  • 改变最后两层金属掩膜可以定制具体模型,成本和时间低于完全重新设计芯片。

  • 模型蚀刻到芯片中无法更改和升级,首发芯片HC1只能使用Llama 3.1 8B版模型。

  • Taalas称定制芯片全程只需2个月,降低了设计新芯片的成本。

延伸问答

Taalas的芯片技术有什么独特之处?

Taalas将AI模型直接蚀刻到芯片中,使芯片通电后即为模型,性能达到每秒1.7万Tokens。

Taalas的芯片在性能上有多大提升?

Taalas的H1C芯片单用户推理速度达到17,000+Tokens/秒,性能显著提升。

Taalas的技术有哪些优势和劣势?

优势是性能极快,劣势是模型无法升级,需重新流片。

Taalas的芯片设计过程需要多长时间?

通过两层金属掩膜定制芯片全程只需约2个月。

Taalas的首发芯片使用了哪个模型?

首发芯片HC1蚀刻的是Llama 3.1 8B版模型。

Taalas的融资情况如何?

Taalas已完成1.69亿美元融资,总融资超过2.19亿美元。

➡️

继续阅读