本文回顾了作者创业11年的历程,并介绍了上海AI LAB发布的DualVLN模型。该模型结合视觉-语言导航推理与实时控制,采用双系统架构,分别负责高层推理和低层动作执行,提升了动态环境中的导航能力。实验结果表明,DualVLN在多种场景中表现优异,成功率高,导航误差低。
Moravec悖论指出,计算机在高层推理(如数学)方面表现优异,但在感知和运动任务(如面孔识别)上却面临挑战。这一现象促使我们重新审视智能的定义,强调人类的自然能力是经过亿万年进化而来的,而现代AI仍难以复制这些看似“简单”的任务。
完成下面两步后,将自动完成登录并继续当前操作。