小红花·文摘

机器之心数据服务现已上线，提供高效稳定的数据获取，简化数据爬取流程。

ICML 2025 Spotlight | 多模态大模型暴露短板？EMMA基准深度揭秘多模态推理能力

机器之心 ·

本研究提出了EMMA基准，用于评估多模态大语言模型在数学、物理、化学和编程等领域的推理能力。结果表明，现有模型在复杂的多模态推理任务中存在显著局限，强调了改进模型架构和训练方法的必要性。

Can Multimodal Large Language Models Reason? EMMA: Enhanced Multimodal Reasoning Benchmark

BriefGPT - AI 论文速递 ·

本研究提出Emma-X模型，旨在解决传统强化学习在不同环境和未见对象任务中的推广问题，通过结合多模态信息，增强机器人在空间推理和规划方面的能力。

Emma-X: A Multimodal Action Model with Foundational Thinking Chains and Anticipatory Spatial Reasoning

BriefGPT - AI 论文速递 ·

Waymo最近宣布其Robotaxi每周载客超过15万单，5个月内增长三倍，预计年底将突破20万单/周。随着运营范围扩大和商业策略调整，Waymo的商业化进展加速。此外，Waymo推出了基于大模型Gemini的多模态模型EMMA，尽管存在局限性，但显示出技术转型的潜力。自动驾驶行业正迎来新的春天。

1周载客15万单，Waymo跑出Robotaxi商业化最佳成绩

量子位 ·

Waymo希望利用谷歌的Gemini来训练其无人驾驶出租车

The Verge ·

本文探讨了多模态方案在自动驾驶中的应用，结合RGB和深度信息以提升AI模型性能。研究表明，早期融合多模态数据优于单模态表现。通过DriveGPT4和DriveWorld框架，增强了自主驾驶系统的鲁棒性和适应性。此外，提出了CoVLA数据集，推动了多模态大语言模型在视觉、语言和动作处理中的能力。

EMMA：端到端多模态自动驾驶模型

BriefGPT - AI 论文速递 ·

本研究介绍了EMMA-500，一个在546种语言上持续训练的大规模多语言模型，旨在提升低资源语言的表现。通过MaLA语料库的持续预训练，Llama 2 7B模型在跨语言转移、任务泛化和语言适应性方面表现显著，尤其在少数语言上效果突出。研究强调了词汇扩展和持续训练的重要性。

EMMA-500：增强大规模多语言适应性的语言模型

BriefGPT - AI 论文速递 ·

Spotify 开发者 Emma Bostian 谈编程、招聘开发人员及欧洲工作文化

freeCodeCamp.org ·

本文介绍了EMMA模型，该模型在交互和具身任务中实现了Dialog-guided Task Completion的新最佳结果。同时，研究提出了多模态生成模型DiffBlender，优化了文本与图像的一致性，并通过可学习的嵌入提升了视觉感知任务的性能。此外，提出了Prompt-Free Diffusion框架，利用视觉输入生成图像，展示了文本作为跨模态接口的潜力。

EMMA: 您的文本到图像扩散模型可秘密接受多模态提示

BriefGPT - AI 论文速递 ·

EMMA是一种编码-解码模型，能够处理交互和具身任务，并在Alexa Arena中的对话引导代理中取得了新的最佳结果。

多任务多模态提示训练用于交互式具象任务完成

BriefGPT - AI 论文速递 ·

翻译者来水一发题解~ 右上角博客食用……其实口味并不更佳啊这，我翻译已经够清楚了吧，Emma要让餐费尽可能高，而Jack为了让餐费变低，会选择街上餐馆费用最小值，所以Emma会选择餐费最小值最高的街道，所以就是每一行最小值的最大值。代码如下： #include <iostream>using namespace std;int n, m;int main() { cin >> n...

题解 CF616B 【Dinner with Emma】

CLCK's Blog ·