量子位 ·

腾讯AI Lab开源可复现的深度研究智能体，最大限度降低外部依赖

💡 原文中文，约2600字，阅读约需7分钟。

📝

内容提要

腾讯AI Lab推出全开源的Cognitive Kernel-Pro智能体框架，旨在降低外部依赖并提升可复现性。该框架结合大语言模型与视觉-语言模型，支持多模块设计，优化任务处理效率，表现优于现有开源框架。

🎯

🔎

Cognitive Kernel-Pro框架采用模块化架构，主智能体负责任务分解，子智能体专注于特定任务。这种设计不仅提升了任务处理的效率，还增强了系统的扩展性，使得开发者可以根据需求灵活调整和优化各个模块。

框架引入的反思机制和投票机制显著提升了任务完成的质量。反思机制允许智能体审查和修正先前的决策，确保在复杂和高随机性的任务中，能够选择最优的解决方案，从而提高整体稳定性和可靠性。

Cognitive Kernel-Pro的全开源特性降低了开发者的使用成本，促进了技术的普及与创新。通过使用免费工具，开发者能够更广泛地应用该框架，推动智能体技术的进步，尤其是在资源有限的环境中。

❓

Cognitive Kernel-Pro框架采用模块化架构，结合大语言模型和视觉-语言模型，支持多模块设计，优化任务处理效率。

通过“进度状态”机制，智能体能够记录已完成步骤和待办任务，从而提升复杂任务的处理效率。

Cognitive Kernel-Pro在GAIA基准测试中超越了SmolAgents，性能接近依赖付费工具的智能体，强调最大限度降低外部依赖。

框架设计了全面的训练流程，包括高质量Web Agent数据构建和推理数据优化，确保训练数据的质量和相关性。

主智能体与子智能体通过标准化任务接口进行通信，确保模块之间的协作与调试。

未来的工作将关注将反思能力蒸馏到同一个Agent基座模型中，以进一步提升智能体的性能。

🏷️