她们估值840亿,刚发了第一个AI成果
内容提要
Thinking Machines发布首篇研究,探讨大语言模型推理中的不确定性,指出批次不变性是关键问题。创始人Mira Murati强调科学分享的重要性,团队成员来自OpenAI,已完成20亿美元融资,估值达120亿美元。
关键要点
-
Thinking Machines发布首篇研究,探讨大语言模型推理中的不确定性。
-
创始人Mira Murati强调科学分享的重要性,团队成员来自OpenAI。
-
公司已完成20亿美元融资,估值达120亿美元。
-
研究主题为克服大语言模型推理中的不确定性,指出批次不变性是关键问题。
-
浮点数计算的非结合性导致推理结果难以复现。
-
解决方案包括让RMSNorm、矩阵乘法和注意力机制具备批次不变性。
-
研究验证了确定性推理的有效性和性能损失在可接受范围内。
-
Thinking Machines团队成员背景强大,主要来自OpenAI。
-
公司第一个产品名为Connection Machine,致敬连接主义。
延伸解读
大语言模型的推理挑战
Thinking Machines的研究揭示了大语言模型推理中的不确定性主要源于批次不变性问题。这一发现对AI模型的稳定性和可靠性至关重要,尤其是在实际应用中,确保相同输入能产生一致输出是提升用户体验的关键。
科学分享的重要性
创始人Mira Murati强调科学分享的价值,表明Thinking Machines将与研究社区保持开放的联系。这种透明度不仅有助于推动技术进步,也可能吸引更多的合作与投资,促进AI领域的整体发展。
团队背景与行业影响
Thinking Machines的团队成员大多来自OpenAI,拥有丰富的行业经验和技术积累。这种强大的背景使得公司在技术研发和市场竞争中具备了显著优势,可能会对AI行业的未来发展产生深远影响。
延伸问答
Thinking Machines的首篇研究主要探讨了什么问题?
主要探讨了大语言模型推理中的不确定性,指出批次不变性是关键问题。
Mira Murati在Thinking Machines中担任什么角色?
她是Thinking Machines的创始人,曾任OpenAI的CTO。
Thinking Machines的估值和融资情况如何?
公司已完成20亿美元融资,估值达120亿美元。
研究中提到的浮点数计算非结合性对推理结果有什么影响?
浮点数计算的非结合性导致推理结果难以复现,不同计算顺序会产生不同结果。
Thinking Machines的第一个产品是什么?
第一个产品名为Connection Machine,致敬连接主义。
如何解决大语言模型推理中的批次不变性问题?
需要让RMSNorm、矩阵乘法和注意力机制具备批次不变性,确保计算顺序不受批次大小影响。