智源研究院在“2025智源具身智能Open Day”上汇聚众多机器人企业,院长王仲远提出通过数据共享提升机器人智能,目标是成为具身智能时代的“安卓”,打破数据孤岛,提供开源数据和统一评测标准,促进行业合作与创新。
王仲远指出,多模态大模型是人工智能发展的关键,能更好地支持产业应用。他强调Scaling Law在模型提升中的重要性,未来需激发图像、音频等多模态数据的智能。智源研究院在大模型研发中处于领先地位,推动具身智能技术的发展。
智源研究院与大连理工大学、北京大学等合作推出了新一代无编码器的视觉语言模型EVE。EVE通过去除视觉编码器,能处理任意图像长宽比,并通过精细化的训练策略和额外的视觉监督,在多个视觉-语言基准测试中表现出色,与基于编码器的主流多模态方法相媲美。EVE的提出为纯解码器的原生多模态架构发展提供了一条透明且高效的路径。
完成下面两步后,将自动完成登录并继续当前操作。