小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

11.17-11.21 AI 论文推荐

AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

HyperAI超神经
HyperAI超神经 · 2025-11-21T07:16:56Z
好奇心周刊第21期: 推理模型的构建与未来

本文介绍了推理模型的定义、构建方法及未来发展。推理模型是一种大语言模型,能够进行复杂逻辑推理。构建方法包括推理阶段扩展、纯强化学习、监督微调与强化学习结合等。未来推理模型将向“研究器”进化,具备更强的学习能力。

好奇心周刊第21期: 推理模型的构建与未来

胡涂说
胡涂说 · 2025-10-28T13:56:00Z
思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

近期的前沿语言模型引入了大型推理模型(LRMs),这些模型在回答前生成详细的思考过程。尽管在推理基准上有所提升,但其基本能力和局限性仍不明确。现有评估主要关注最终答案的准确性,忽视了推理过程的结构和质量。通过可控的难题环境研究发现,当复杂性超出一定范围时,LRMs的准确性会完全崩溃,且在高复杂性任务中表现不佳。

思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-29T00:00:00Z
xAI发布Grok 4 Fast,推出低成本推理模型

xAI推出了Grok 4 Fast,这是一款高效且低成本的推理模型,思维令牌减少40%,成本降低98%。该模型支持200万令牌的上下文窗口,并集成了网页浏览等工具。在基准测试中,Grok 4 Fast在多个任务上表现优异,性价比高于OpenAI的GPT-4 Turbo,社区对其成本与性能的平衡表示关注。

xAI发布Grok 4 Fast,推出低成本推理模型

InfoQ
InfoQ · 2025-09-26T10:35:00Z

攻克大模型训推差异难题,蚂蚁开源新一代推理模型Ring-flash-2.0

机器之心
机器之心 · 2025-09-19T11:06:54Z

清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路

机器之心
机器之心 · 2025-09-13T10:20:50Z

快手开源了多模态推理模型Keye-VL 1.5,具备128k上下文、0.1秒视频定位和跨模态推理能力。该模型在视频理解和推理方面表现优异,能够准确判断物品出现的时间并详细描述场景,在多个基准测试中取得领先成绩。

视频理解新标杆,快手多模态推理模型开源:128k上下文+0.1秒级视频定位+跨模态推理

量子位
量子位 · 2025-09-05T13:39:24Z

M3-Agent框架通过处理实时视觉和听觉输入,构建多模态长期记忆,具备分层的情景和语义记忆机制,展现出接近人类的智能特征。实验结果显示,其在长期信息保持和推理方面优于传统模型。

AI 论文周报丨多模态记忆智能体/视觉基础模型/推理模型等多领域成果一键速览

HyperAI超神经
HyperAI超神经 · 2025-08-22T06:59:00Z

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

机器之心
机器之心 · 2025-08-17T12:00:16Z

刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

机器之心
机器之心 · 2025-08-12T02:51:24Z
CrowdStrike、Uber、Zoom等行业先锋利用NVIDIA Nemotron和Cosmos推理模型构建更智能的代理,服务于企业和物理AI应用

开放推理模型提升了AI代理的智能决策能力,预计到2028年将为企业创造4500亿美元收益。NVIDIA推出的Nemotron和Cosmos模型增强了AI代理的推理能力,助力企业提高生产力,尤其在科学推理和编码等复杂任务的自动化决策中表现突出。

CrowdStrike、Uber、Zoom等行业先锋利用NVIDIA Nemotron和Cosmos推理模型构建更智能的代理,服务于企业和物理AI应用

NVIDIA Blog
NVIDIA Blog · 2025-08-11T15:00:13Z

OpenAI发布了gpt-oss-120b和gpt-oss-20b两款开源大模型,前者适合复杂推理,后者适合低延迟应用。gpt-oss采用MoE架构,性能强大且计算需求低,支持在消费级硬件上运行。评测显示,gpt-oss-120b在多个任务中优于o3-mini,gpt-oss-20b表现也很出色。用户可通过HyperAI官网体验和部署这些模型。

一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini

HyperAI超神经
HyperAI超神经 · 2025-08-11T02:43:04Z
最强推理模型 GPT-5 已发布!Xroute 可免费体验!

OpenAI于8月8日发布了新一代AI模型GPT-5,具备更强的编程、创意写作和健康问诊能力,优化了回答的统一系统和推理模型,表现优于前代,开启了AI与人类社会的新协作模式。

最强推理模型 GPT-5 已发布!Xroute 可免费体验!

APISpace
APISpace · 2025-08-08T09:55:19Z

OpenAI发布了gpt-oss-120b和gpt-oss-20b两个开源大模型,前者适合复杂推理,后者适合低延迟应用。两者在多项测试中表现优异,能够在消费级硬件上运行,满足多场景需求。

一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini

HyperAI超神经
HyperAI超神经 · 2025-08-07T19:32:43Z

OpenAI重新开源!深夜连发两个推理模型,o4-mini水平,笔记本、手机可跑

机器之心
机器之心 · 2025-08-06T02:28:50Z

OpenAI开源了两个推理模型gpt-oss-120b和gpt-oss-20b,分别拥有1170亿和210亿参数,支持在笔记本和手机上运行。它们的推理性能接近闭源模型,但在复杂任务中稍显不足。此举旨在推动AI民主化,降低使用门槛,促进创新。

刚刚,OpenAI开源2个推理模型:笔记本/手机就能跑,性能接近o4-mini

量子位
量子位 · 2025-08-05T21:45:47Z
RLVR的力量:在Databricks上训练领先的SQL推理模型

在Databricks,我们通过可验证奖励的强化学习(RLVR)开发推理模型,解决客户问题并提升产品性能。在BIRD基准测试中,我们取得73.5%的新高,证明了RLVR的有效性和易用性,帮助用户更好地与数据互动。

RLVR的力量:在Databricks上训练领先的SQL推理模型

Databricks
Databricks · 2025-07-30T15:15:29Z

本文探讨了大型推理模型在无关文本干扰下的脆弱性,提出了自动化攻击方法CatAttack,通过添加无关“触发文本”导致模型输出错误答案。研究表明,添加无关文本显著提高了错误率,且蒸馏模型更易受到攻击,呼吁关注模型的鲁棒性并开发防御机制。

用猫干扰推理大模型:面向推理模型的查询无关对抗触发方法

程序师
程序师 · 2025-07-30T13:58:28Z

阶跃星辰发布的Step 3是一个开源的多模态推理模型,拥有321B参数,推理效率高且成本低,支持国产芯片,适应性强,已在多个领域应用,预计2025年收入将近10亿人民币。

什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的

量子位
量子位 · 2025-07-28T01:44:48Z

阿里巴巴推出的千问3推理模型性能显著提升,成为全球最强开源模型,超越Gemini-2.5 pro和o4-mini。在知识、逻辑推理和编程等领域表现卓越,Qwen3-Coder被誉为最佳编程模型,推动AI编程热潮。阿里已开源300余款模型,未来将继续投资AI基础设施。

阿里千问3推理模型重磅更新,比肩Gemini-2.5 pro、o4-mini

量子位
量子位 · 2025-07-25T10:54:10Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码