微软亚洲研究院启动“铸星计划”,邀请全球青年学者进行为期三个月的研究,聚焦空间智能与具身AI,旨在推动AI在三维环境中的应用与发展,促进学术与产业合作。
本研究提出了一种新的嵌入式均值场演员-评论家框架(EMFAC),用于优化三维环境中的周界防御策略。模拟实验表明,EMFAC在收敛速度和整体表现上优于传统方法,展示了其在复杂场景中的有效性和适应性。
本研究提出了一种新颖的神经上下文场景图方法,旨在帮助机器理解未见或嘈杂的三维环境中的场景上下文。该方法通过提取和对齐场景区域的语义和几何信息,提高了在复杂室内场景中识别类比和转移轨迹的能力,具有在机器人和增强现实/虚拟现实中的应用潜力。
本研究提出的GenEx系统解决了AI在理解三维物理世界方面的不足。该系统能够从单幅RGB图像生成完整的三维环境,具备高质量的世界生成和强大的三维映射能力,为AI代理在虚拟空间中执行复杂任务提供了转型平台,具有实际应用潜力。
该研究针对多模态大语言模型在复杂三维环境中的本地化和对象消歧义问题,提出了有效技术,提升了句子相似性评价和三维空间理解能力,对协作机器人系统的整合具有重要意义。
完成下面两步后,将自动完成登录并继续当前操作。