小红花·文摘

本研究提出了一种名为时间线组装器的生成模型，通过自然语言指令简化复杂视频编辑任务，使非专家用户能够轻松操作。研究开发了大型多模态语言模型，并创建了新数据集，验证结果显示该模型在执行复杂指令方面显著优于现有模型。