英特尔推出了DeepMath,一个基于Qwen3-Thinking的轻量级数学问题解决代理。它通过生成小型Python脚本来增强数学推理,减少错误和输出长度。DeepMath在多个数据集上表现优异,使用GRPO训练提高准确性,并在沙箱环境中安全执行代码。该工具已在GitHub和Hugging Face上发布。
本研究推出了DeepMath-103K,一个大规模的数学问题数据集,旨在解决人工智能在复杂数学推理中的数据不足问题。该数据集提供验证答案,提升了挑战性,并展示了训练模型在数学基准测试中的显著改进,为发展更强大的AI推理系统奠定基础。
完成下面两步后,将自动完成登录并继续当前操作。