本文报道了几个与人工智能相关的新闻,包括X.AI推出的多模态模型Grok-1.5V,腾讯云服务故障原因,Adobe购买视频生成模型,清华大学发布的AI光芯片太极,以及Ai Pin的评价。
特拉斯结合大模型实现自动驾驶,Grok-1.5V能将“像素->动作”映射提升为“像素->语言->动作”。Grok-1.5V解决自动驾驶中边缘情况的潜力,使用语言进行“思维链”将有助于汽车分解复杂的场景,用规则和反事实进行推理,并解释其决定。
马斯克的xAI推出了Grok-1.5V多模态模型,能处理文本、文档、图表、截图和照片,并在物理世界理解方面表现优秀。Grok-1.5V与其他模型进行了测试对比,并展示了七个示例,包括流程图转换为Python代码、计算卡路里、睡前故事等。xAI还推出了RealWorldQA基准测试,用于评估多模态模型的真实世界空间理解能力。微软推出了MEGAVERSE基准测试,Meta开源了OpenEQA基准数据集。预计2024年大模型在现实世界任务上取得更多进展。
完成下面两步后,将自动完成登录并继续当前操作。