小红花·文摘 - 小红花技术领袖俱乐部

数学竞赛金牌背后：大模型打败专用模型的真正原因

数学竞赛金牌背后：大模型打败专用模型的真正原因

极道 ·

大脑逻辑与语言是分离的：失语症患者照样玩数独

大脑逻辑与语言是分离的：失语症患者照样玩数独

极道 ·

全球首个英伟达含量为0的万亿模型，成了海外开发者的抢手货

全球首个英伟达含量为0的万亿模型，成了海外开发者的抢手货

量子位 ·

人工智能论文评审：语言模型是少量学习者（GPT-3）

人工智能论文评审：语言模型是少量学习者（GPT-3）

freeCodeCamp.org ·

美团 LongCat 开源 General 365：树立推理评测新标尺

美团 LongCat 开源 General 365：树立推理评测新标尺

美团技术团队 ·

2026深度评测：DeepSeek V4 vs ChatGPT 5.5 大模型选型全指南

2026深度评测：DeepSeek V4 vs ChatGPT 5.5 大模型选型全指南

极客技术博客’s Blog ·

本文介绍了 OpenClaw 的思考模式（Think），强调其在复杂任务中的重要性。开启 Think 模式后，模型会进行内部推理，从而提升代码生成和逻辑推理的质量。建议使用 Coding Plan 的用户将思考级别设为中或高，以充分利用固定月费的优势。虽然开启 Think 模式会增加 Token 消耗，但 Coding Plan 可以有效控制成本。最后，提供了一些设置检查清单，以确保用户合理配置思考级别。

用了 Coding Plan 还没开 Think？你可能浪费了一半的钱

LearnData 开源笔记 ·

88岁图灵奖得主，用Claude一小时破解30年数学悬案

88岁图灵奖得主，用Claude一小时破解30年数学悬案

量子位 ·

巨头的核电圈地运动：一场盛大的刻舟求剑

巨头的核电圈地运动：一场盛大的刻舟求剑

dotNET跨平台 ·

大型语言模型（LLM）随着规模的扩大展现出新的技能，尤其在逻辑推理方面得益于代码数据的结构化特性。开源运动为人工智能的发展提供了重要支持，AI的进步与开源文化密切相关。

AI 弑父

Est's Blog ·

我用豆包大模型2.0手搓了macOS，Seedance 2.0后字节再送春节AI大礼

我用豆包大模型2.0手搓了macOS，Seedance 2.0后字节再送春节AI大礼

爱范儿 ·

数据集汇总丨16个具身智能数据集，覆盖抓握/问答/逻辑推理/轨迹推理等领域

数据集汇总丨16个具身智能数据集，覆盖抓握/问答/逻辑推理/轨迹推理等领域

HyperAI超神经 ·

智力题总结

智力题总结

Sekyoro的博客小屋 ·

智谱宣布开源旗舰模型GLM-4.7 对训练数据进行大规模清洗提升代码生成能力

智谱宣布开源旗舰模型GLM-4.7 对训练数据进行大规模清洗提升代码生成能力

蓝点网 ·

数据质量与验证检查的提示工程

数据质量与验证检查的提示工程

KDnuggets ·

忽视先前指示：人工智能仍然困惑于基本推理

忽视先前指示：人工智能仍然困惑于基本推理

The New Stack ·

好奇心周刊第21期: 推理模型的构建与未来

好奇心周刊第21期: 推理模型的构建与未来

胡涂说 ·

ChatGPT-5能否提供高级数学的证明？

ChatGPT-5能否提供高级数学的证明？

MachineLearningMastery.com ·

百度发布的文心X1.1模型在事实性、指令遵循和智能体能力上有显著提升，支持复杂任务的自动拆分和工具调用，逻辑推理和事实检验表现优异。同时，开源ERNIE-4.5-21B-A3B-Thinking模型，提供全栈开发工具链，助力开发者创新应用。

文心X1.1发布！这三大能力突出，一手实测在此

量子位 ·

读书笔记.m | 戈德门特《代数学教程》

读书笔记.m | 戈德门特《代数学教程》

阿掖山：一个博客 ·