小红花·文摘

本研究评估了大型多模态模型（LMMs）在视觉类比推理上的性能，并与儿童和成年人进行比较。结果显示，LMMs在量化变化方式并应用于新对象时存在困难，而儿童和成年人在类比推理能力上更强。这突显了在二维图像和文本数据上训练模型的局限性。

BriefGPT - AI 论文速递 ·

本文介绍了一种名为Instant3D的零样本三维生成模型，能够快速将二维图像转化为高质量三维资产。该模型结合文本提示和图像信息，通过两阶段方法生成结构化视图，有效解决了生成过程中的多样性和一致性问题。研究表明，该方法在20秒内生成3D对象，显著提高了效率和质量。

BriefGPT - AI 论文速递 ·