字节跳动豆包大模型团队经过8个月的研究发现,视频生成模型能够记忆训练案例,但缺乏对物理规律的真正理解,无法泛化到新场景。尽管在熟悉概念下表现良好,模型仍依赖记忆,缺乏抽象能力。
在2024国际基础科学大会“基础科学与人工智能论坛”上,AI专家讨论了人工智能的发展方向,包括大模型的抽象能力、主观价值和情感知识,商业应用的超级产品,模型泛化性和互动性的思考,智能体的能力边界,模型的幻觉问题和落地挑战。
本研究评估了语言模型在开放领域中的抽象能力,发现现有模型在零样本和少样本情况下理解抽象知识存在挑战。通过训练,模型的抽象能力得以提升,并能推广到新事件。提出的AbsInstruct框架结合指导和抽象知识,显著增强了模型的推理性能。同时,研究探讨了语言模型与人类认知的差异,强调了发展具备概念意识的模型的重要性。
完成下面两步后,将自动完成登录并继续当前操作。