小红花·文摘 - 小红花技术领袖俱乐部

深入探讨思维机器的交互模型

深入探讨思维机器的交互模型

ByteByteGo Newsletter ·

C# OnnxRuntime 部署 DAViD 深度估计

C# OnnxRuntime 部署 DAViD 深度估计

dotNET跨平台 ·

Mythos架构被22岁小伙“逆推”开源了！MoE和注意力借鉴DeepSeek

量子位 ·

MiroFlow：面向深度研究任务的高性能开源智能体框架

MiroFlow：面向深度研究任务的高性能开源智能体框架

Micropaper ·

字节Seed通过化学思想重新定义AI长链思维，提出深度推理、自我反思和自我探索三种思维行为，形成稳定的推理结构。这些行为在推理过程中相互作用，提升模型的逻辑聚焦和思维覆盖，进而提高推理效率。

字节Seed用化学思想搞AI，把DeepSeek-R1的脑回路拆成了分子结构

量子位 ·

Kimi K2思维：我国思维模型的真正觉醒

Kimi K2思维：我国思维模型的真正觉醒

云原生 ·

Moonshot AI的Kimi K2思维模型现已在Vercel AI Gateway上提供

Moonshot AI的Kimi K2思维模型现已在Vercel AI Gateway上提供

Vercel News ·

生成式推荐（GRs）在过去一年取得显著进展，依托大型语言模型（LLM）提升推荐性能，形成新范式。传统推荐面临特征工程和模型复杂度的瓶颈，而LLM通过长序列建模和知识注入有效解决冷启动问题。未来，GRs将重点关注深度推理、多模态对齐和并行生成优化，重构推荐系统的价值链。

探索无限可能：生成式推荐的演进、前沿与挑战【AI业务应用方向】

FreeBuf网络安全行业门户 ·

探索无限可能：生成式推荐的演进、前沿与挑战【AI业务应用方向】

探索无限可能：生成式推荐的演进、前沿与挑战【AI业务应用方向】

京东科技开发者 ·

同样是 Sonnet 4.5，为何 CLI 工具差距这么大

同样是 Sonnet 4.5，为何 CLI 工具差距这么大

技术小黑屋 ·

Mini-o3是字节与港大联合开发的开源视觉推理模型，支持多轮深度推理，突破传统模型限制。通过冷启动微调和强化学习，Mini-o3在视觉搜索任务中表现优异，显著超越现有模型，提供多样化推理模式。

全新开源模型复现o3视觉推理，无需大量训练即可实现深度思考

量子位 ·

夸克健康大模型成功通过主任医师评测，成为国内首个完成此挑战的大模型，已集成至夸克AI搜索中。该模型具备深度推理能力，吸引了众多医学生和医生使用。

国内首个通过主任医师评测的大模型，已在夸克AI搜索上线

量子位 ·

张丽及其团队在微软亚洲研究院引入“System2”概念，提升大模型的深度推理能力。通过蒙特卡洛搜索算法，7B模型的数学推理能力接近OpenAI的o1，激发了学术界的广泛讨论。她指出智商和推理能力是大模型应用的关键，未来将继续优化奖励模型并扩展任务领域。

她如何把“系统2”带给了大模型｜对话微软亚洲研究院张丽

量子位 ·

本研究提出了一种新的奖励建模方法，旨在解决深度推理模型在低资源语言翻译中的不足。与大型推理模型相比，该方法在文学翻译中表现出色，并成功扩展至11种语言，实现了90个翻译方向的优异性能。

ExTrans: Multilingual Deep Reasoning Translation via Exemplar-Enhanced Reinforcement Learning

BriefGPT - AI 论文速递 ·

Qwen 3 基准测试、比较、模型规格及更多信息

Qwen 3 基准测试、比较、模型规格及更多信息

DEV Community ·

迈向推理时代：900+篇参考文献揭示长链思维的前世今生，最全综述来了

迈向推理时代：900+篇参考文献揭示长链思维的前世今生，最全综述来了

机器之心 ·

微软为研究和数据分析新增‘深度推理’Copilot AI

微软为研究和数据分析新增‘深度推理’Copilot AI

The Verge ·

本研究提出了一种新的视觉定位任务——知识密集型视觉定位（KVG），旨在提升多模态大语言模型的视觉推理能力。通过引入DeepPerception模型和自动化数据合成框架，研究表明在KVG-Bench数据集上显著提高了准确率，推动了多模态推理的发展。

DeepPerception: Advancing R1-like Cognitive Visual Perception in Multimodal Large Language Models to Support Knowledge-Intensive Visual Grounding

BriefGPT - AI 论文速递 ·

首发体验|百度连发两个新模型对标DeepSeek，我让它挑西瓜、卖烧烤，细节全在这了

首发体验|百度连发两个新模型对标DeepSeek，我让它挑西瓜、卖烧烤，细节全在这了

爱范儿 ·

本研究综述了长链思维在大型语言模型推理中的重要性，提出了新的分类法，探讨了深度推理和广泛探索的特征，并明确了未来的研究方向，以促进人工智能逻辑推理的发展。

Towards the Era of Reasoning: An Investigation of Long Chain Thinking in Large Language Model Inference

BriefGPT - AI 论文速递 ·