小红花·文摘 - 小红花技术领袖俱乐部

在线教程丨多模态协同的视频生成框架HuMo-1.7B，实现图文声一体的视频创作体验

在线教程丨多模态协同的视频生成框架HuMo-1.7B，实现图文声一体的视频创作体验

HyperAI超神经 ·

Hugging Face推出mmBERT，一种支持1800多种语言的多语言编码器

Hugging Face推出mmBERT，一种支持1800多种语言的多语言编码器

InfoQ ·

InfiGUI-R1：从反应式执行向推理式决策的进阶之路

InfiGUI-R1：从反应式执行向推理式决策的进阶之路

NotionNext BLOG ·

EAGLES：轻量级编码的高效加速3D高斯 | ECCV 2024

EAGLES：轻量级编码的高效加速3D高斯 | ECCV 2024

实时互动网 ·

本研究提出了一种名为Loong的新型自回归模型，通过将文本和视频标记统一建模，并采用渐进式训练方法，提升了生成长视频的能力。该模型能从10秒视频扩展生成符合文本提示的长视频，具有创新性和实用性。

Loong：使用自回归语言模型生成分钟级长视频

BriefGPT - AI 论文速递 ·