该研究提出了一种新的推理分割任务,展示了多模态语言模型LISA在复杂推理分割中的有效性。研究还介绍了开放词汇视频实例分割任务及其数据集,提出了VLP-RVOS框架以解决视频对象分割中的转移挑战,并开发了LLM-Seg框架,连接基础分割模型与大型语言模型,生成高质量的推理分割数据集LLM-Seg40K。
完成下面两步后,将自动完成登录并继续当前操作。