小红花·文摘

机器人版的「斯坦福小镇」来了，专为具身智能研究打造

机器之心 ·

开源3D医学大模型SAT，支持497类器官，性能超越72个nnU-Nets，上交大团队发布

机器之心 ·

上海AI Lab主任、首席科学家周伯文亮相WAIC，人工智能45°平衡律主张首次曝光

机器之心 ·

上海人工智能实验室推出了类sora开源系统Latte，将DiT和U-ViT架构应用于视频生成领域。Latte使用潜在扩散模型进行扩散和去噪过程，通过预训练的变分自动编码器将视频帧压缩到潜在空间中，并在潜在空间中进行扩散过程。Latte的主干网络有四种变体，分别是空间和时间交替进行、先空间再时间、空间和时间统一、空间和时间分开。Latte的输出是预测的噪声和协方差。Open-Sora 1.0是基于STDiT架构的类Sora模型，使用PixArt-α作为基座，并引入时间注意力层。Open-Sora的训练复现方案包括三个阶段：大规模图像预训练、大规模视频预训练和微调。数据预处理脚本可降低复现门槛。

视频生成Sora的从零复现：从Latte、Open-Sora(含1.0及其升级版)到StreamingT2V

结构之法算法之道 ·

上海人工智能实验室、华东师范大学、普林斯顿大学、香港大学推出了名为《OS-Copilot：迈向自我完善的多面手计算机代理》的框架，能够与操作系统元素交互。该框架使用Python代码和GPT-4语言模型构建了名为Friday的代理，性能优于GPT-4。这是人工智能操作系统的工作演示，系统将变得更好。

上海AI实验室推出自主学习操作系统OS-Copilot

极道 ·