机器之心 ·

AI封神了！无剪辑一次直出60秒《猫和老鼠》片段，全网百万人围观

💡 原文中文，约3900字，阅读约需10分钟。

📝

内容提要

加州大学伯克利分校等机构联合制作的《猫和老鼠》AI短片引发关注。该短片利用测试时训练（TTT）层生成，展示了复杂的动态故事。研究者使用预训练的Diffusion Transformer生成了一分钟的连贯视频，展示了AI在动画创作中的新进展。

🎯

🔎

《猫和老鼠》短片的成功展示了AI在动画创作中的潜力，尤其是通过TTT层的应用，生成了连贯且复杂的故事。这一技术的进步可能会影响未来动画制作的方式，降低制作成本并提高创作效率。

尽管TTT-MLP在生成视频的连贯性和复杂性上表现出色，但仍存在时间一致性和运动自然性等问题。这些瑕疵提醒我们，AI生成内容的质量仍需不断优化，尤其是在动态场景的表现上。

与传统的RNN层相比，TTT层在处理长上下文时展现了更好的性能。这一对比强调了新技术在生成复杂故事时的优势，同时也指出了传统模型在动态视频生成中的局限性，未来可能需要更多创新来克服这些挑战。

❓

该短片由加州大学伯克利分校、斯坦福大学和英伟达等机构联合制作。

短片利用测试时训练（TTT）层生成，所有视频由模型一次性直接生成，没有进行任何二次编辑。

TTT层生成的视频在连贯性和复杂动态故事讲述上优于其他基线模型。

短片包含五集，每集都是全新的故事，展示了复杂的动态情节。

TTT-MLP存在时间一致性、运动自然性和美学等方面的问题。

研究者通过与Mamba 2、Gated DeltaNet等基线模型的对比，评估TTT层生成视频的连贯性和故事复杂性。

🏷️