从事物的位置到它们的用途:多模态大语言模型的空间–功能智能基准评估
Apple Machine Learning Research
·
谷歌最强具身大脑发布!波士顿机器狗瞬间人模人样
量子位
·
利用多模态大语言模型推进自我中心视频问答
Apple Machine Learning Research
·
面向多模态大语言模型的视觉文本定位
BriefGPT - AI 论文速递
·