小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
我用 AI 翻译的三个阶段:提示词时代 → 推理模型时代 → Agent 时代

本文讲述了作者在AI翻译领域的两年探索,从手动提示词逐步转向使用Agent进行自动化翻译。通过迭代,作者创建了可复用的翻译技能,解决了输入多样性、翻译质量和一致性等问题,最终实现高效翻译工作流。

我用 AI 翻译的三个阶段:提示词时代 → 推理模型时代 → Agent 时代

宝玉的分享
宝玉的分享 · 2026-03-05T00:00:00Z
NVIDIA通过自主AI蓝图和电信推理模型推动自主网络发展

自主网络正从愿景转向电信运营商的实际需求。NVIDIA报告指出,网络自动化是AI投资的首要应用。自主网络需理解运营商意图并做出决策,NVIDIA推出开放的LTM模型和节能蓝图,助力运营商实现自主运营。

NVIDIA通过自主AI蓝图和电信推理模型推动自主网络发展

NVIDIA Blog
NVIDIA Blog · 2026-03-01T07:00:45Z
推理模型中的轨迹长度是一个简单的不确定性信号

大型推理模型的不确定性量化是解决幻觉等问题的关键。研究表明,推理轨迹长度是有效的信心估计器,能够与其他零-shot信心估计器互补。推理后训练改变了轨迹长度与准确率的关系,高熵“分叉”标记在其中起到关键作用。

推理模型中的轨迹长度是一个简单的不确定性信号

Apple Machine Learning Research
Apple Machine Learning Research · 2026-02-12T00:00:00Z

即刻体验国内最强推理模型Qwen3-Max-Thinking,千问PC和网页端已接入

机器之心
机器之心 · 2026-01-27T05:34:43Z

11.17-11.21 AI 论文推荐

AI 论文周报丨通用Agent开发/目标检测/开源物理推理模型……一文了解 AI 前沿动态

HyperAI超神经
HyperAI超神经 · 2025-11-21T07:16:56Z
好奇心周刊第21期: 推理模型的构建与未来

本文介绍了推理模型的定义、构建方法及未来发展。推理模型是一种大语言模型,能够进行复杂逻辑推理。构建方法包括推理阶段扩展、纯强化学习、监督微调与强化学习结合等。未来推理模型将向“研究器”进化,具备更强的学习能力。

好奇心周刊第21期: 推理模型的构建与未来

胡涂说
胡涂说 · 2025-10-28T00:00:00Z
思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

近期的前沿语言模型引入了大型推理模型(LRMs),这些模型在回答前生成详细的思考过程。尽管在推理基准上有所提升,但其基本能力和局限性仍不明确。现有评估主要关注最终答案的准确性,忽视了推理过程的结构和质量。通过可控的难题环境研究发现,当复杂性超出一定范围时,LRMs的准确性会完全崩溃,且在高复杂性任务中表现不佳。

思维的幻觉:通过问题复杂性视角理解推理模型的优势与局限性

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-29T00:00:00Z
xAI发布Grok 4 Fast,推出低成本推理模型

xAI推出了Grok 4 Fast,这是一款高效且低成本的推理模型,思维令牌减少40%,成本降低98%。该模型支持200万令牌的上下文窗口,并集成了网页浏览等工具。在基准测试中,Grok 4 Fast在多个任务上表现优异,性价比高于OpenAI的GPT-4 Turbo,社区对其成本与性能的平衡表示关注。

xAI发布Grok 4 Fast,推出低成本推理模型

InfoQ
InfoQ · 2025-09-26T10:35:00Z

攻克大模型训推差异难题,蚂蚁开源新一代推理模型Ring-flash-2.0

机器之心
机器之心 · 2025-09-19T11:06:54Z

清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路

机器之心
机器之心 · 2025-09-13T10:20:50Z

快手开源了多模态推理模型Keye-VL 1.5,具备128k上下文、0.1秒视频定位和跨模态推理能力。该模型在视频理解和推理方面表现优异,能够准确判断物品出现的时间并详细描述场景,在多个基准测试中取得领先成绩。

视频理解新标杆,快手多模态推理模型开源:128k上下文+0.1秒级视频定位+跨模态推理

量子位
量子位 · 2025-09-05T13:39:24Z

M3-Agent框架通过处理实时视觉和听觉输入,构建多模态长期记忆,具备分层的情景和语义记忆机制,展现出接近人类的智能特征。实验结果显示,其在长期信息保持和推理方面优于传统模型。

AI 论文周报丨多模态记忆智能体/视觉基础模型/推理模型等多领域成果一键速览

HyperAI超神经
HyperAI超神经 · 2025-08-22T06:59:00Z

400万人围观的分层推理模型,「分层架构」竟不起作用?性能提升另有隐情?

机器之心
机器之心 · 2025-08-17T12:00:16Z

刚刚,OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺得IMO金牌

机器之心
机器之心 · 2025-08-12T02:51:24Z
CrowdStrike、Uber、Zoom等行业先锋利用NVIDIA Nemotron和Cosmos推理模型构建更智能的代理,服务于企业和物理AI应用

开放推理模型提升了AI代理的智能决策能力,预计到2028年将为企业创造4500亿美元收益。NVIDIA推出的Nemotron和Cosmos模型增强了AI代理的推理能力,助力企业提高生产力,尤其在科学推理和编码等复杂任务的自动化决策中表现突出。

CrowdStrike、Uber、Zoom等行业先锋利用NVIDIA Nemotron和Cosmos推理模型构建更智能的代理,服务于企业和物理AI应用

NVIDIA Blog
NVIDIA Blog · 2025-08-11T15:00:13Z

OpenAI发布了gpt-oss-120b和gpt-oss-20b两款开源大模型,前者适合复杂推理,后者适合低延迟应用。gpt-oss采用MoE架构,性能强大且计算需求低,支持在消费级硬件上运行。评测显示,gpt-oss-120b在多个任务中优于o3-mini,gpt-oss-20b表现也很出色。用户可通过HyperAI官网体验和部署这些模型。

一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini

HyperAI超神经
HyperAI超神经 · 2025-08-11T02:43:04Z
最强推理模型 GPT-5 已发布!Xroute 可免费体验!

OpenAI于8月8日发布了新一代AI模型GPT-5,具备更强的编程、创意写作和健康问诊能力,优化了回答的统一系统和推理模型,表现优于前代,开启了AI与人类社会的新协作模式。

最强推理模型 GPT-5 已发布!Xroute 可免费体验!

APISpace
APISpace · 2025-08-08T09:55:19Z

OpenAI发布了gpt-oss-120b和gpt-oss-20b两个开源大模型,前者适合复杂推理,后者适合低延迟应用。两者在多项测试中表现优异,能够在消费级硬件上运行,满足多场景需求。

一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini

HyperAI超神经
HyperAI超神经 · 2025-08-07T19:32:43Z

OpenAI重新开源!深夜连发两个推理模型,o4-mini水平,笔记本、手机可跑

机器之心
机器之心 · 2025-08-06T02:28:50Z

OpenAI开源了两个推理模型gpt-oss-120b和gpt-oss-20b,分别拥有1170亿和210亿参数,支持在笔记本和手机上运行。它们的推理性能接近闭源模型,但在复杂任务中稍显不足。此举旨在推动AI民主化,降低使用门槛,促进创新。

刚刚,OpenAI开源2个推理模型:笔记本/手机就能跑,性能接近o4-mini

量子位
量子位 · 2025-08-05T21:45:47Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码