她们估值840亿,刚发了第一个AI成果

💡 原文中文,约3500字,阅读约需9分钟。
📝

内容提要

Thinking Machines发布首篇研究,探讨大语言模型推理中的不确定性,指出批次不变性是关键问题。创始人Mira Murati强调科学分享的重要性,团队成员来自OpenAI,已完成20亿美元融资,估值达120亿美元。

🎯

关键要点

  • Thinking Machines发布首篇研究,探讨大语言模型推理中的不确定性。

  • 创始人Mira Murati强调科学分享的重要性,团队成员来自OpenAI。

  • 公司已完成20亿美元融资,估值达120亿美元。

  • 研究主题为克服大语言模型推理中的不确定性,指出批次不变性是关键问题。

  • 浮点数计算的非结合性导致推理结果难以复现。

  • 解决方案包括让RMSNorm、矩阵乘法和注意力机制具备批次不变性。

  • 研究验证了确定性推理的有效性和性能损失在可接受范围内。

  • Thinking Machines团队成员背景强大,主要来自OpenAI。

  • 公司第一个产品名为Connection Machine,致敬连接主义。

延伸问答

Thinking Machines的首篇研究主要探讨了什么问题?

主要探讨了大语言模型推理中的不确定性,指出批次不变性是关键问题。

Mira Murati在Thinking Machines中担任什么角色?

她是Thinking Machines的创始人,曾任OpenAI的CTO。

Thinking Machines的估值和融资情况如何?

公司已完成20亿美元融资,估值达120亿美元。

研究中提到的浮点数计算非结合性对推理结果有什么影响?

浮点数计算的非结合性导致推理结果难以复现,不同计算顺序会产生不同结果。

Thinking Machines的第一个产品是什么?

第一个产品名为Connection Machine,致敬连接主义。

如何解决大语言模型推理中的批次不变性问题?

需要让RMSNorm、矩阵乘法和注意力机制具备批次不变性,确保计算顺序不受批次大小影响。

➡️

继续阅读