小红花·文摘 - 小红花技术领袖俱乐部

VITA-1.5：多模态大语言模型，通过三阶段训练方法整合视觉、语言和语音

VITA-1.5：多模态大语言模型，通过三阶段训练方法整合视觉、语言和语音

实时互动网 ·

本研究利用3D-ViTac系统结合触觉与视觉数据，显著提升了低成本机器人在脆弱物品交互中的多模态感知能力和精细操控性能。

3D-ViTac: Learning Fine Manipulation through Visual-Tactile Perception

BriefGPT - AI 论文速递 ·

没有等来OpenAI开源GPT-4o，等来了开源版VITA

没有等来OpenAI开源GPT-4o，等来了开源版VITA

机器之心 ·

PlayStation Vita 依然称霸

PlayStation Vita 依然称霸

The Verge ·