小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Modular:来自MLSys 2026的三大趋势

Modular在MLSys 2026大会上讨论了推理技术的最新进展,强调AI代理在低级代码生成中的重要性。会议展示了多种优化技术,如高效的KV缓存管理和异构硬件应用,以提升推理性能。Modular的架构支持跨组件优化,以适应行业需求的变化。

Modular:来自MLSys 2026的三大趋势

Modular Blog
Modular Blog · 2026-05-29T00:00:00Z
人工智能周刊第330期 - Groq并入英伟达、ChatGPT应用、美国人工智能创世纪任务

英伟达以约200亿美元收购Groq资产,并获得其推理技术许可。Groq将继续独立运营,CEO及高管将加入英伟达。英伟达计划将Groq的低延迟处理器整合进其AI架构,以支持实时工作负载。

人工智能周刊第330期 - Groq并入英伟达、ChatGPT应用、美国人工智能创世纪任务

Last Week in AI
Last Week in AI · 2025-12-25T08:51:51Z
从云原生到AI原生:我们将走向何方?

在KubeCon + CloudNativeCon北美大会上,专家探讨了云原生时代是否已转变为AI原生时代。与会者指出,推理技术在边缘计算和个性化网站中愈发重要,WebAssembly技术可提升推理的速度和安全性。同时,安全性和可观察性在AI时代变得至关重要,基础设施管理也面临新挑战。

从云原生到AI原生:我们将走向何方?

The New Stack
The New Stack · 2025-11-28T20:00:13Z
DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文

2025年,Deepseek R1等大语言模型的推理技术备受关注。研究者提出思维链和动态计算等改进策略,以提升模型的推理能力。通过增加训练和推理计算,模型在复杂任务中的表现显著提高,未来推理将成为大语言模型的标准配置,推动其在各领域的应用。

DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文

机器之心
机器之心 · 2025-04-01T08:14:44Z
科研领域新成果:九章云极 DataCanvas 联合团队发布 R1 复现以及改进技术

中国人民大学与九章云极团队在大模型推理技术上取得新进展,复现类R1模型并开源实现。新模型STILL-3-Tool-32B在AIME 2024测试中准确率达到81.70%,超越DeepSeek-R1,推动AI推理能力提升。

科研领域新成果:九章云极 DataCanvas 联合团队发布 R1 复现以及改进技术

机器之心
机器之心 · 2025-03-14T03:00:00Z

本研究探讨推理技术对大型语言模型(LLMs)角色扮演能力的影响,发现推理能力可能会降低角色扮演表现,未来研究应关注角色推理和强化学习。

推理并不一定能提高角色扮演能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z
最低调的「AI 六小龙」阶跃星辰,在 DeepSeek 浪潮中交出了一份新答卷

阶跃星辰在首届Step UP生态开放日上介绍了其AGI探索方式,重点发展多模态推理技术,应用于汽车和手机等智能终端。创始人姜大昕指出,智能终端将成为智能体技术的关键载体,结合多模态和推理能力,推动AI落地。公司已发布11款多模态大模型,并与清华大学合作研发开源推理模型,致力于实现AGI目标。

最低调的「AI 六小龙」阶跃星辰,在 DeepSeek 浪潮中交出了一份新答卷

爱范儿
爱范儿 · 2025-02-21T12:31:41Z
加入我,参加加州大学伯克利分校RDI高级大型语言模型代理MOOC课程

加州大学伯克利分校RDI中心推出了一门高级大型语言模型代理的MOOC课程,旨在推动去中心化的科学与教育。课程将于2025年1月至4月进行,内容包括推理技术和代理安全,参与者可选择应用或研究轨道,完成后可获得证书。

加入我,参加加州大学伯克利分校RDI高级大型语言模型代理MOOC课程

DEV Community
DEV Community · 2025-02-03T23:49:35Z

本文介绍了生成式AI Agent的概念及其工作原理。Agent通过工具扩展语言模型能力,自主规划和执行复杂任务。核心在于编排层,结合推理技术如ReAct和Chain-of-Thought,实现信息接收与决策。工具连接Agent与外部世界,支持实时信息检索和数据访问,推动应用发展。

[译] AI Agent(智能体)技术白皮书(Google,2024)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-01-07T00:00:00Z

这篇文章介绍了一个名为Awesome-LLM-Strawberry的GitHub库,收集了与o1相关的推理技术论文、博客和项目等资源。其中包括OpenAI o1的训练方法、o1-mini模型的改进、GPT-4模型的错误修正方法等。还介绍了一些由OpenAI o1贡献者撰写的论文,如解决数学问题的验证器训练、语言模型在自动定理证明中的应用等。文章还提到了一些可能与o1相关的其他论文。

关注o1必备GitHub仓库,上线3天狂揽1.5k星!英伟达工程师出品!

量子位
量子位 · 2024-09-19T05:34:49Z

本文综述了大型语言模型(LLMs)在各领域的高效部署方法,分析了推理技术的瓶颈及优化策略,包括权重优化、解码算法和硬件增强。研究探讨了LLMs在法律、教育和工业中的应用及面临的挑战,为研究人员和从业者提供了有价值的见解。

LLM 推理服务:近期进展和机遇的调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-17T00:00:00Z

本文介绍了知识图谱的概念、应用及演化,比较了不同知识图谱的内容和覆盖范围,探讨了知识提取和推理技术在金融分析等领域的应用,并提出了未来研究方向,包括结合大型语言模型与知识图谱的能力。

地理空间知识图谱

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-13T00:00:00Z

病患中心知识图谱(PCKGs)是医疗保健领域的重要转变,通过以整体性和多维度的方式映射患者的健康信息,聚焦于个体化患者护理。本文综述了PCKGs的方法学、挑战和机遇,以及它们在整合医疗保健数据和增强患者护理方面的作用。文章强调了推理、语义搜索和推理机制等先进技术在构建和评估可行的PCKGs时的重要性,并探讨了PCKGs在个体化医学中的实际应用。

基于患者的知识图谱研究:现有方法、挑战和应用综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-20T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码