本研究提出了一种名为时间线组装器的生成模型,通过自然语言指令简化复杂视频编辑任务,使非专家用户能够轻松操作。研究开发了大型多模态语言模型,并创建了新数据集,验证结果显示该模型在执行复杂指令方面显著优于现有模型。
完成下面两步后,将自动完成登录并继续当前操作。