解道jdon.com 解道jdon.com -

AGI来了?特拉斯用大模型帮助自动驾驶

Grok-1.5V能将“像素->动作”映射提升为“像素->语言->动作”。Tesla FSD v13可能会是Grokking语言令牌。Grok-1.5V最让人兴奋的是解决自动驾驶中边缘情况的潜力。使用语言进行“思维链”将有助于汽车分解复杂的场景,用规则和反事实进行推理,并解释其决定。网友讨论:1、这听起来像是通往AGI的最可行的道路。具有显式语言推理的多模态模型一致地推断出世界模型。2、特斯拉视觉系统基于虚拟视频训练,它从记录和神经网络训练中编译,基于视频到标记数据的实时转换。语言从何而来?3、我真的不明白这是怎么回事。Grok是X,FSD是Tesla。我知道马斯克拥有这两个部门,但这是如何发

特拉斯结合大模型实现自动驾驶,Grok-1.5V能将“像素->动作”映射提升为“像素->语言->动作”。Grok-1.5V解决自动驾驶中边缘情况的潜力,使用语言进行“思维链”将有助于汽车分解复杂的场景,用规则和反事实进行推理,并解释其决定。

Grok-1.5V agi 像素->语言->动作 大模型 特拉斯 自动驾驶 边缘情况

相关推荐 去reddit讨论