小红花·文摘 - 小红花技术领袖俱乐部

在 Amazon SageMaker 上部署 Fast-Whisper：Async endpoint推理部署实践总结

在 Amazon SageMaker 上部署 Fast-Whisper：Async endpoint推理部署实践总结

亚马逊AWS官方博客 ·

从 0 到 1 打造 Labubu ，MiniMax Agent 让我看到了智能体未来的样子

从 0 到 1 打造 Labubu ，MiniMax Agent 让我看到了智能体未来的样子

爱范儿 ·

该研究提出了一种统一的大规模视觉语言模型（LVLM），Video-LLaVA，具备像素级定位和音频转写能力，提升视频理解。通过混合模态适应方法（MMA），实现图像与语言模型的联合优化，展现出在多种任务中的优异性能，具有成为通用聊天机器人的潜力。

FreeVA: 离线 MLLM 作为无需训练的视频助手

BriefGPT - AI 论文速递 ·