本研究探讨大型语言模型(LLM)在复杂推理中的表现,强调推理结构的重要性。研究发现,长链推理的结构对学习至关重要,而单个推理步骤的内容影响较小,为未来模型训练提供指导。
LLaVA-o1是一种新型视觉语言模型,采用四阶段推理结构和阶段级束搜索技术,显著提升了多模态任务的推理准确性和效率。实验结果显示,其在多个基准测试中表现优异,推动了视觉与文本处理的发展。
SELF-DISCOVER是一个通用的框架,用于自我发现任务内在的推理结构,提高推理问题的解决能力。相较于CoT,性能提升高达32%。在推理计算量较少的情况下,超过了CoT-Self-Consistency等推理密集型方法20%以上。自我发现的推理结构在不同模型族之间是普适的。
完成下面两步后,将自动完成登录并继续当前操作。