机器之心 ·

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

💡 原文中文，约4500字，阅读约需11分钟。

📝

内容提要

AIxiv专栏促进了学术交流，报道了2000多篇内容。尽管多模态大语言模型（MLLM）在简单任务上表现良好，但在复杂推理中仍显不足。本文提出集体蒙特卡罗树搜索（CoMCTS），通过多个模型协同学习推理路径，提升了MLLM的推理能力，并构建了Mulberry模型，显著提高了推理性能。

🎯

关键要点

AIxiv专栏促进了学术交流，报道了2000多篇内容。
多模态大语言模型（MLLM）在复杂推理任务中表现不佳，缺乏中间推理能力。
提出集体蒙特卡罗树搜索（CoMCTS），通过多个模型协同学习推理路径，提升MLLM的推理能力。
CoMCTS的优势在于联合扩展多个MLLM的推理路径，支持跨模型协同推理。
CoMCTS通过结合正负推理节点构建反思推理数据，提升了推理能力。
Mulberry模型在8个基准测试上取得了显著提升，验证了CoMCTS的有效性。
CoMCTS的推理路径搜索包括扩展、模拟与错误定位、反向传播和选择四个关键操作。
实验结果显示，Mulberry模型在多个基准测试中优于现有模型，展现出竞争力。
CoMCTS的消融实验验证了其设计的有效性，逐步引入更多模型提升成功率。
CoMCTS在搜索效果和效率上具有显著优势，避免了陷入单一推理空间的困境。

❓

延伸问答

什么是集体蒙特卡罗树搜索（CoMCTS）？

CoMCTS是一种新的学习推理方法，通过多个模型协同学习推理路径，提升多模态大语言模型（MLLM）的推理能力。

CoMCTS如何提高MLLM的推理能力？

CoMCTS通过联合扩展多个MLLM的推理路径，支持跨模型协同推理，结合正负推理节点构建反思推理数据，从而提升推理能力。

Mulberry模型的表现如何？

Mulberry模型在8个基准测试中取得了显著提升，验证了CoMCTS的有效性，展现出竞争力。

CoMCTS的推理路径搜索包括哪些关键操作？

CoMCTS的推理路径搜索包括扩展、模拟与错误定位、反向传播和选择四个关键操作。

CoMCTS与传统树搜索方法相比有什么优势？

CoMCTS在搜索效果和效率上具有显著优势，避免了陷入单一推理空间的困境，能够跨多个MLLM进行推理。

CoMCTS如何构建反思性推理数据？

CoMCTS通过结合正负推理节点，识别并整合负向推理节点，构建反思性推理路径。

🏷️

继续阅读

使用Transformers.js和句子嵌入构建语义搜索
本文介绍了如何使用Transformers.js和句子嵌入构建客户端语义搜索引擎，包括句子嵌入的工作原理、余弦相似度的计算、嵌入的生成与缓存，以及可重用的...
macOS 存储管理漫谈：去重是节约空间的最好方法
文章讨论了macOS的存储管理，强调手动清理垃圾文件的重要性。虽然macOS会定期自动清理临时文件，但许多被标记为垃圾的文件实际上对系统有用。清理软件主要...
SuperX首个美国AI推理云中心在丹佛投入运营
SuperX AI Technology Limited在丹佛正式启用首个美国AI推理云中心，基于NVIDIA技术，提供高性能、低延迟的AI推理服务，已被...
41 项人体试验告诉你：哪些抗衰老方法真能逆转生物学年龄
一项系统回顾分析了41项抗衰老人体试验，发现司美格鲁肽、鱼油和复合维生素等方法有效，而血浆置换和某些补品则无效或有害。新一代表观遗传时钟能更准确测量生物学...
模块化：为什么LLM推理需要一种新型路由器 - 第三部分
Modular Cloud的路由层通过准备、过滤、评分、选择和执行五个阶段实现高效请求处理。该框架支持可组合插件，快速实现新路由优化，适应不同工作负载需求...
谷歌允许社交媒体明星自定义他们的搜索结果页面
谷歌允许美国的大型创作者和出版商申请专属搜索资料，展示他们的在线内容，如视频和文章。此功能仅限于拥有至少10万YouTube订阅者、10万Instagra...