小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

MEAI 更新至 10.4.0 版本,新增推理内容类型,便于获取推理字段。课程讲解如何启用推理模型、获取推理内容及其应用,支持流式和非流式获取,提升用户体验。

.NET+AI | MEAI | 获取推理内容新姿势

dotNET跨平台
dotNET跨平台 · 2026-03-14T00:02:06Z
老黄入局吃龙虾!英伟达发布最强开源Agent推理模型

英伟达发布了开源模型Nemotron 3 Super,参数达到120B,性能优越,吞吐量提升5倍。未来五年将投入260亿美元用于开源AI模型研发,推动技术进步并开放模型权重和部署手册。

老黄入局吃龙虾!英伟达发布最强开源Agent推理模型

量子位
量子位 · 2026-03-12T04:58:38Z
微软最新的Phi-4推理模型认为,规模并非一切

微软的Phi-4推理模型探索小型模型在低计算成本下与大型AI模型的竞争能力。该模型结合文本和图像处理,注重高质量数据和高效训练,旨在提升推理能力,而非单纯追求模型规模。

微软最新的Phi-4推理模型认为,规模并非一切

The New Stack
The New Stack · 2026-03-10T19:51:50Z
GPT-5.4思维系统卡

GPT-5.4 Thinking是最新的推理模型,首次在网络安全领域实施了强大的安全缓解措施,基于GPT-5.3 Codex的最新方法。

GPT-5.4思维系统卡

OpenAI
OpenAI · 2026-03-05T10:00:00Z
推理模型难以控制其思维链,这其实是件好事

随着AI代理执行复杂任务,监控其行为变得至关重要。研究表明,当前推理模型在控制思维链方面能力不足,尽管模型规模增大可提高可控性,但长时间推理会降低其效果。因此,思维链的监控变得更加可靠,未来需持续评估以确保安全。

推理模型难以控制其思维链,这其实是件好事

OpenAI
OpenAI · 2026-03-05T10:00:00Z
我用 AI 翻译的三个阶段:提示词时代 → 推理模型时代 → Agent 时代

本文讲述了作者在AI翻译领域的两年探索,从手动提示词逐步转向使用Agent进行自动化翻译。通过迭代,作者创建了可复用的翻译技能,解决了输入多样性、翻译质量和一致性等问题,最终实现高效翻译工作流。

我用 AI 翻译的三个阶段:提示词时代 → 推理模型时代 → Agent 时代

宝玉的分享
宝玉的分享 · 2026-03-05T00:00:00Z
NVIDIA通过自主AI蓝图和电信推理模型推动自主网络发展

自主网络正从愿景转向电信运营商的实际需求。NVIDIA报告指出,网络自动化是AI投资的首要应用。自主网络需理解运营商意图并做出决策,NVIDIA推出开放的LTM模型和节能蓝图,助力运营商实现自主运营。

NVIDIA通过自主AI蓝图和电信推理模型推动自主网络发展

NVIDIA Blog
NVIDIA Blog · 2026-03-01T07:00:45Z
推理模型中的轨迹长度是简单的不确定性信号

本文探讨了推理模型中推理轨迹长度作为置信度估计器的作用。研究表明,推理后训练改变了轨迹长度与准确性之间的关系,且在多种模型和数据集上,轨迹长度与其他置信度估计器相辅相成。此外,高熵或“分叉”标记在这一机制中起着关键作用,证明推理后训练增强了不确定性量化能力。

推理模型中的轨迹长度是简单的不确定性信号

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-12T00:00:00Z
即刻体验国内最强推理模型Qwen3-Max-Thinking,千问PC和网页端已接入

抱歉,您提供的文本内容过于简短,无法进行有效总结。请提供更详细的文章内容。

即刻体验国内最强推理模型Qwen3-Max-Thinking,千问PC和网页端已接入

机器之心
机器之心 · 2026-01-27T05:34:43Z

谷歌研究表明,DeepSeek-R1等推理模型在解题时会自发产生不同性格的虚拟人格,通过内部对话增强推理能力。在面对复杂任务时,这种“脑内群聊”更加活跃,从而提高了模型的准确性,类似于人类的社交思维。

谷歌新发现:DeepSeek推理分裂出多重人格,左右脑互搏越来越聪明

量子位
量子位 · 2026-01-20T05:01:03Z
在生产中扩展人工智能代理所需的条件

随着推理模型的发布,复杂问题的解决可通过标准API实现。然而,依赖大型语言模型(LLM)作为中间件会导致可扩展性瓶颈,缺乏共享语义层的通用代理架构使得系统难以有效处理多跳推理,最终输出不可靠。构建可扩展产品需关注上下文层、编排层和治理层,以避免“胶水代码”问题。

在生产中扩展人工智能代理所需的条件

The New Stack
The New Stack · 2026-01-06T20:00:46Z
AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

上海人工智能实验室开发的P1系列开源物理推理模型在物理学研究中取得显著进展,特别是在国际奥林匹克物理竞赛中表现突出,P1-235B-A22B模型有望在2025年竞赛中获得金牌。

AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

HyperAI超神经
HyperAI超神经 · 2025-11-21T07:16:56Z
gpt-oss-safeguard技术报告

gpt-oss-safeguard-120b和gpt-oss-safeguard-20b是基于gpt-oss模型的开放权重推理模型,旨在根据政策标记内容,支持多种推理方式和结构化输出,适用于内容分类,但不适合直接与用户交互。报告评估了其安全性和多语言性能。

gpt-oss-safeguard技术报告

OpenAI
OpenAI · 2025-10-29T00:00:00Z
好奇心周刊第21期: 推理模型的构建与未来

本文介绍了推理模型的定义、构建方法及未来发展。推理模型是一种大语言模型,能够进行复杂逻辑推理。构建方法包括推理阶段扩展、纯强化学习、监督微调与强化学习结合等。未来推理模型将向“研究器”进化,具备更强的学习能力。

好奇心周刊第21期: 推理模型的构建与未来

胡涂说
胡涂说 · 2025-10-28T00:00:00Z
思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

近期的前沿语言模型引入了大型推理模型(LRMs),这些模型在回答前生成详细的思考过程。尽管在推理基准上有所提升,但其基本能力和局限性仍不明确。现有评估主要关注最终答案的准确性,忽视了推理过程的结构和质量。通过可控的难题环境研究发现,当复杂性超出一定范围时,LRMs的准确性会完全崩溃,且在高复杂性任务中表现不佳。

思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-29T00:00:00Z
xAI推出了Grok 4 Fast,具备低成本推理模型

xAI推出了Grok 4 Fast,这是一种高效且低成本的推理模型。与Grok 4相比,思维令牌减少40%,成本降低约98%。该模型支持2百万令牌的上下文窗口,并具备网页浏览等工具使用能力。在基准测试中,Grok 4 Fast表现优异,成本效益高于OpenAI的GPT-4 Turbo。用户可通过grok.com免费试用该模型。

xAI推出了Grok 4 Fast,具备低成本推理模型

InfoQ
InfoQ · 2025-09-26T10:35:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,简化数据爬取流程。

攻克大模型训推差异难题,蚂蚁开源新一代推理模型Ring-flash-2.0

机器之心
机器之心 · 2025-09-19T11:06:54Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路

机器之心
机器之心 · 2025-09-13T10:20:50Z

快手开源了多模态推理模型Keye-VL 1.5,具备128k上下文、0.1秒视频定位和跨模态推理能力。该模型在视频理解和推理方面表现优异,能够准确判断物品出现的时间并详细描述场景,在多个基准测试中取得领先成绩。

视频理解新标杆,快手多模态推理模型开源:128k上下文+0.1秒级视频定位+跨模态推理

量子位
量子位 · 2025-09-05T13:39:24Z

M3-Agent框架通过处理实时视觉和听觉输入,构建多模态长期记忆,具备分层的情景和语义记忆机制,展现出接近人类的智能特征。实验结果显示,其在长期信息保持和推理方面优于传统模型。

AI 论文周报丨多模态记忆智能体/视觉基础模型/推理模型等多领域成果一键速览

HyperAI超神经
HyperAI超神经 · 2025-08-22T06:59:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码