芯片公司Taalas将AI模型蚀刻到芯片电路中性能达到惊人的每秒1.7万个Token

蓝点网 ·

芯片公司Taalas将AI模型蚀刻到芯片电路中性能达到惊人的每秒1.7万个Token

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

加拿大初创公司Taalas将AI模型直接蚀刻到芯片中，性能达到每秒1.7万Tokens。该技术使芯片通电后即为模型，速度极快，但无法升级，需重新流片。Taalas已完成1.69亿美元融资，展示其定制化芯片技术。

🎯

关键要点

加拿大初创公司Taalas将AI模型蚀刻到芯片中，性能达到每秒1.7万Tokens。
该技术使芯片通电后即为模型，速度极快，但无法升级，需重新流片。
Taalas已完成1.69亿美元融资，展示其定制化芯片技术。
Taalas的技术将大型语言模型的部分结构直接硬编码到硅芯片上。
H1C芯片单用户推理速度达到17,000+Tokens/秒，性能显著提升。
该技术类似于90年代的门阵列，利用古老技术接近LLM参数稀疏性和量化带来的复杂性。
芯片设计中，权重和计算结构通过晶体管和金属线蚀刻在硅芯片中。
改变最后两层金属掩膜可以定制具体模型，成本和时间低于完全重新设计芯片。
模型蚀刻到芯片中无法更改和升级，首发芯片HC1只能使用Llama 3.1 8B版模型。
Taalas称定制芯片全程只需2个月，降低了设计新芯片的成本。

❓

延伸问答

Taalas的芯片技术有什么独特之处？

Taalas将AI模型直接蚀刻到芯片中，使芯片通电后即为模型，性能达到每秒1.7万Tokens。

Taalas的芯片在性能上有多大提升？

Taalas的H1C芯片单用户推理速度达到17,000+Tokens/秒，性能显著提升。

Taalas的技术有哪些优势和劣势？

优势是性能极快，劣势是模型无法升级，需重新流片。

Taalas的芯片设计过程需要多长时间？

通过两层金属掩膜定制芯片全程只需约2个月。

Taalas的首发芯片使用了哪个模型？

首发芯片HC1蚀刻的是Llama 3.1 8B版模型。

Taalas的融资情况如何？

Taalas已完成1.69亿美元融资，总融资超过2.19亿美元。

🏷️

继续阅读

我们的TPU如何支持日益增长的AI工作负载
谷歌的TPU（张量处理单元）是专为AI模型设计的定制芯片，具备121 exaflops的计算能力和双倍带宽。
AWS 收购对话式 AI 公司 NLX，Amazon Connect 部署周期从数月压缩至数周
亚马逊云科技（AWS）宣布将对话式AI平台NLX整合进Amazon Connect，实现无代码可视化设计，显著缩短AI客户体验的部署周期。这一整合提升了A...
定了，DeepSeek V4首发华为芯片！国产AI开始打破英伟达「垄断」
DeepSeek发布了V4系列模型，包括V4-Pro和V4-Flash，参数量分别为1.6T和284B，支持百万token上下文。V4-Pro在编程任务中...
继续屠杀全球AI模型：DeepSeek V4 API价格公布起步价仅0.2元/百万输入
深度求索发布了DeepSeek V4模型，起步价为每百万输入0.2元，交付质量接近Claude Opus 4.6。V4系列包括Flash和Pro两种型号，...
我如何用简单英语测试马来西亚的开放数据门户
文章讨论了如何使用Passmark库为马来西亚公共开放数据门户创建自动化回归测试。传统端到端测试无法验证页面上数字的准确性，而Passmark通过范围限定...
国内首家百亿估值纯推理GPU独角兽诞生！专访曦望联席CEO王湛：谁的推理成本更低谁就是赢家
曦望公司在一年内完成七轮融资，成为国内首家估值超百亿的纯推理GPU独角兽。王湛表示，推理算力需求激增，未来将超越训练算力。新一代推理GPU芯片启望S3旨在...

芯片公司Taalas将AI模型蚀刻到芯片电路中 性能达到惊人的每秒1.7万个Token