本文介绍了Open-Sora 1.1的视频生成效果和体验方法。Open-Sora是一个开源解决方案,可生成2s~15s,144p到720p分辨率的视频,支持文本到图像、文本到视频和图像到视频的生成。用户可以通过运行代码和模型来体验Open-Sora 1.1的视频生成效果。
本研究提出了一个名为SAT的模型,可在医疗场景中对任意物体进行分割。通过整合多个知识源构建多模态医学知识树,并使用超过11,000个三维医学图像扫描的大规模分割数据集进行训练。提出了通用的分割模型,使用医学术语进行提示,并提出了知识增强的表示学习框架和有效训练策略。通过对31个不同的分割数据集进行评估,使用SAT-Nano模型得到了362个类别的结果,性能相当于36个专家nnUNets模型。研究将公布代码和模型,并提供SAT-Ultra模型在更多数据集上进行训练。
本文介绍了一种适应场景的分层多平面图像表示方法,用于合成新视角。该方法在KITTI数据集上具有显著性能提升,并在Tanks and Temples数据集上具有较好的泛化性能。代码和模型将公开。
完成下面两步后,将自动完成登录并继续当前操作。