小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
微软将在Build大会上发布新的AI模型和Windows改进

微软将在Build大会上发布新的AI模型和Windows改进,包括Copilot超级应用和新的推理AI模型。会议将专注于提升开发者体验,推出优化的Windows 11开发者环境,并介绍本地计算模型的应用。微软还将展示首个推理模型MAI-Thinking-1及其他新模型,以恢复开发者信任,特别是在GitHub方面。

微软将在Build大会上发布新的AI模型和Windows改进

The Verge
The Verge · 2026-06-01T14:39:03Z
推理模型终极指南:从“直觉反应”到“深度思考”的范式转移(2026)

推理模型标志着人工智能从被动知识检索向主动逻辑推演的转变。到2026年,推理模型广泛应用于开发、科研和复杂决策中,核心技术包括思维链、推理时计算和强化学习,使模型具备深度思考能力,能够自我纠错并处理复杂任务,如数学证明和代码重构。推理模型在高智力密度领域表现出色,成为AI发展的重要里程碑。

推理模型终极指南:从“直觉反应”到“深度思考”的范式转移(2026)

极客技术博客’s Blog
极客技术博客’s Blog · 2026-05-12T21:41:34Z
自适应并行推理:高效推理扩展的新范式

自适应并行推理(APR)是一种新兴的推理模型,能够动态决定何时并行化和分解任务。与传统顺序推理相比,APR通过并行处理多个线程,提高了推理效率,降低了延迟。研究表明,APR在复杂任务中表现出更高的准确性和更低的计算成本,但仍需解决训练稳定性和硬件适应性等问题。

自适应并行推理:高效推理扩展的新范式

The Berkeley Artificial Intelligence Research Blog
The Berkeley Artificial Intelligence Research Blog · 2026-05-08T09:00:00Z

本文讨论了从单机到多节点分布式推理部署的架构变化,强调了流水线并行(PP)与张量并行(TP)的结合使用。通过与Ray框架集成,vLLM实现了高效的分布式推理,管理集群资源并协调任务。文章还介绍了Ray集群的搭建、vLLM的配置及生产环境的优化建议,包括网络通信、性能调优和监控等关键步骤。

vLLM集成Ray分布式推理模型部署实战

安志合的学习博客
安志合的学习博客 · 2026-05-05T12:50:03Z

MEAI 更新至 10.4.0 版本,新增推理内容类型,便于获取推理字段。课程讲解如何启用推理模型、获取推理内容及其应用,支持流式和非流式获取,提升用户体验。

.NET+AI | MEAI | 获取推理内容新姿势

dotNET跨平台
dotNET跨平台 · 2026-03-14T00:02:06Z
老黄入局吃龙虾!英伟达发布最强开源Agent推理模型

英伟达发布了开源模型Nemotron 3 Super,参数达到120B,性能优越,吞吐量提升5倍。未来五年将投入260亿美元用于开源AI模型研发,推动技术进步并开放模型权重和部署手册。

老黄入局吃龙虾!英伟达发布最强开源Agent推理模型

量子位
量子位 · 2026-03-12T04:58:38Z
微软最新的Phi-4推理模型认为,规模并非一切

微软的Phi-4推理模型探索小型模型在低计算成本下与大型AI模型的竞争能力。该模型结合文本和图像处理,注重高质量数据和高效训练,旨在提升推理能力,而非单纯追求模型规模。

微软最新的Phi-4推理模型认为,规模并非一切

The New Stack
The New Stack · 2026-03-10T19:51:50Z
GPT-5.4思维系统卡

GPT-5.4 Thinking是最新的推理模型,首次在网络安全领域实施了强大的安全缓解措施,基于GPT-5.3 Codex的最新方法。

GPT-5.4思维系统卡

OpenAI
OpenAI · 2026-03-05T10:00:00Z
推理模型难以控制其思维链,这其实是件好事

随着AI代理执行复杂任务,监控其行为变得至关重要。研究表明,当前推理模型在控制思维链方面能力不足,尽管模型规模增大可提高可控性,但长时间推理会降低其效果。因此,思维链的监控变得更加可靠,未来需持续评估以确保安全。

推理模型难以控制其思维链,这其实是件好事

OpenAI
OpenAI · 2026-03-05T10:00:00Z
我用 AI 翻译的三个阶段:提示词时代 → 推理模型时代 → Agent 时代

本文讲述了作者在AI翻译领域的两年探索,从手动提示词逐步转向使用Agent进行自动化翻译。通过迭代,作者创建了可复用的翻译技能,解决了输入多样性、翻译质量和一致性等问题,最终实现高效翻译工作流。

我用 AI 翻译的三个阶段:提示词时代 → 推理模型时代 → Agent 时代

宝玉的分享
宝玉的分享 · 2026-03-05T00:00:00Z
NVIDIA通过自主AI蓝图和电信推理模型推动自主网络发展

自主网络正从愿景转向电信运营商的实际需求。NVIDIA报告指出,网络自动化是AI投资的首要应用。自主网络需理解运营商意图并做出决策,NVIDIA推出开放的LTM模型和节能蓝图,助力运营商实现自主运营。

NVIDIA通过自主AI蓝图和电信推理模型推动自主网络发展

NVIDIA Blog
NVIDIA Blog · 2026-03-01T07:00:45Z
推理模型中的轨迹长度是简单的不确定性信号

本文探讨了推理模型中推理轨迹长度作为置信度估计器的作用。研究表明,推理后训练改变了轨迹长度与准确性之间的关系,且在多种模型和数据集上,轨迹长度与其他置信度估计器相辅相成。此外,高熵或“分叉”标记在这一机制中起着关键作用,证明推理后训练增强了不确定性量化能力。

推理模型中的轨迹长度是简单的不确定性信号

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-12T00:00:00Z
即刻体验国内最强推理模型Qwen3-Max-Thinking,千问PC和网页端已接入

抱歉,您提供的文本内容过于简短,无法进行有效总结。请提供更详细的文章内容。

即刻体验国内最强推理模型Qwen3-Max-Thinking,千问PC和网页端已接入

机器之心
机器之心 · 2026-01-27T05:34:43Z

谷歌研究表明,DeepSeek-R1等推理模型在解题时会自发产生不同性格的虚拟人格,通过内部对话增强推理能力。在面对复杂任务时,这种“脑内群聊”更加活跃,从而提高了模型的准确性,类似于人类的社交思维。

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

量子位
量子位 · 2026-01-20T05:01:03Z
在生产中扩展人工智能代理所需的条件

随着推理模型的发布,复杂问题的解决可通过标准API实现。然而,依赖大型语言模型(LLM)作为中间件会导致可扩展性瓶颈,缺乏共享语义层的通用代理架构使得系统难以有效处理多跳推理,最终输出不可靠。构建可扩展产品需关注上下文层、编排层和治理层,以避免“胶水代码”问题。

在生产中扩展人工智能代理所需的条件

The New Stack
The New Stack · 2026-01-06T20:00:46Z
AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

上海人工智能实验室开发的P1系列开源物理推理模型在物理学研究中取得显著进展,特别是在国际奥林匹克物理竞赛中表现突出,P1-235B-A22B模型有望在2025年竞赛中获得金牌。

AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

HyperAI超神经
HyperAI超神经 · 2025-11-21T07:16:56Z
gpt-oss-safeguard技术报告

gpt-oss-safeguard-120b和gpt-oss-safeguard-20b是基于gpt-oss模型的开放权重推理模型,旨在根据政策标记内容,支持多种推理方式和结构化输出,适用于内容分类,但不适合直接与用户交互。报告评估了其安全性和多语言性能。

gpt-oss-safeguard技术报告

OpenAI
OpenAI · 2025-10-29T00:00:00Z
好奇心周刊第21期: 推理模型的构建与未来

本文介绍了推理模型的定义、构建方法及未来发展。推理模型是一种大语言模型,能够进行复杂逻辑推理。构建方法包括推理阶段扩展、纯强化学习、监督微调与强化学习结合等。未来推理模型将向“研究器”进化,具备更强的学习能力。

好奇心周刊第21期: 推理模型的构建与未来

胡涂说
胡涂说 · 2025-10-28T00:00:00Z
思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

近期的前沿语言模型引入了大型推理模型(LRMs),这些模型在回答前生成详细的思考过程。尽管在推理基准上有所提升,但其基本能力和局限性仍不明确。现有评估主要关注最终答案的准确性,忽视了推理过程的结构和质量。通过可控的难题环境研究发现,当复杂性超出一定范围时,LRMs的准确性会完全崩溃,且在高复杂性任务中表现不佳。

思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-29T00:00:00Z
xAI推出了Grok 4 Fast,具备低成本推理模型

xAI推出了Grok 4 Fast,这是一种高效且低成本的推理模型。与Grok 4相比,思维令牌减少40%,成本降低约98%。该模型支持2百万令牌的上下文窗口,并具备网页浏览等工具使用能力。在基准测试中,Grok 4 Fast表现优异,成本效益高于OpenAI的GPT-4 Turbo。用户可通过grok.com免费试用该模型。

xAI推出了Grok 4 Fast,具备低成本推理模型

InfoQ
InfoQ · 2025-09-26T10:35:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码