小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
C# OnnxRuntime 部署 DAViD 深度估计

本文介绍了一个深度估计模型的实现,使用Microsoft.ML.OnnxRuntime和OpenCvSharp库。用户可以选择图片进行深度推理,程序处理图像并生成深度彩色图,支持保存结果。详细说明了模型路径和输入输出张量的设置。

C# OnnxRuntime 部署 DAViD 深度估计

dotNET跨平台
dotNET跨平台 · 2026-04-20T23:57:27Z
Mythos架构被22岁小伙“逆推”开源了!MoE和注意力借鉴DeepSeek

OpenMythos是一种新型的循环深度Transformer架构,采用MoE路由机制,通过跨专家权重共享实现高效推理。在参数量减少近一半的情况下,其性能与传统模型相当。研究表明,循环Transformer在处理未见知识组合和深度推理方面表现更佳,可能改变大模型的训练方式,受到学术界关注。

Mythos架构被22岁小伙“逆推”开源了!MoE和注意力借鉴DeepSeek

量子位
量子位 · 2026-04-20T07:59:51Z
MiroFlow:面向深度研究任务的高性能开源智能体框架

MiroFlow是一个高性能的开源智能体框架,旨在克服大型语言模型在复杂任务中的局限性。它通过智能体图、深度推理模式和健壮工作流,提升智能体的自主性和性能,适合深度研究任务,推动AI智能体的发展。

MiroFlow:面向深度研究任务的高性能开源智能体框架

Micropaper
Micropaper · 2026-03-01T10:00:00Z

字节Seed通过化学思想重新定义AI长链思维,提出深度推理、自我反思和自我探索三种思维行为,形成稳定的推理结构。这些行为在推理过程中相互作用,提升模型的逻辑聚焦和思维覆盖,进而提高推理效率。

字节Seed用化学思想搞AI,把DeepSeek-R1的脑回路拆成了分子结构

量子位
量子位 · 2026-02-24T07:23:05Z
Kimi K2思维:我国思维模型的真正觉醒

中国的大语言模型正从“聊天模型”转向“思维模型”。Moonshot AI的Kimi K2思维模型实现了“深度推理、长上下文和工具调用连续性”的统一,标志着中国进入思维模型时代。K2强调推理能力,具备稳定的工具调用、深层推理链和256k上下文,推动中国模型与国际接轨。

Kimi K2思维:我国思维模型的真正觉醒

云原生
云原生 · 2025-11-14T08:25:26Z
Moonshot AI的Kimi K2思维模型现已在Vercel AI Gateway上提供

Moonshot AI推出Kimi K2思维和Kimi K2思维Turbo模型,支持深度推理和快速响应。用户可通过Vercel的AI Gateway无须额外账户访问,享受统一API和性能优化。

Moonshot AI的Kimi K2思维模型现已在Vercel AI Gateway上提供

Vercel News
Vercel News · 2025-11-06T13:00:00Z

生成式推荐(GRs)在过去一年取得显著进展,依托大型语言模型(LLM)提升推荐性能,形成新范式。传统推荐面临特征工程和模型复杂度的瓶颈,而LLM通过长序列建模和知识注入有效解决冷启动问题。未来,GRs将重点关注深度推理、多模态对齐和并行生成优化,重构推荐系统的价值链。

探索无限可能:生成式推荐的演进、前沿与挑战【AI业务应用方向】

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-10-20T08:21:48Z
探索无限可能:生成式推荐的演进、前沿与挑战【AI业务应用方向】

生成式推荐(GRs)在过去一年取得显著进展,利用大型语言模型(LLM)提升推荐性能,形成新范式。传统推荐面临特征工程和模型复杂度的瓶颈,而LLM通过长序列建模和知识注入解决冷启动问题。未来,GRs将专注于深度推理、多模态对齐和并行生成优化,重构推荐系统的价值链,推动智能化发展。

探索无限可能:生成式推荐的演进、前沿与挑战【AI业务应用方向】

京东科技开发者
京东科技开发者 · 2025-10-20T08:16:45Z
同样是 Sonnet 4.5,为何 CLI 工具差距这么大

Claude Code CLI 和 Copilot CLI 都基于 Claude Sonnet 4.5 模型,但性能差异明显。Claude Code 支持 200K tokens 的上下文和扩展思维,适合复杂任务,而 Copilot CLI 仅支持 8K tokens,缺乏深度推理,导致在复杂任务中表现不佳,容易遗忘信息。

同样是 Sonnet 4.5,为何 CLI 工具差距这么大

技术小黑屋
技术小黑屋 · 2025-10-13T00:00:00Z

Mini-o3是字节与港大联合开发的开源视觉推理模型,支持多轮深度推理,突破传统模型限制。通过冷启动微调和强化学习,Mini-o3在视觉搜索任务中表现优异,显著超越现有模型,提供多样化推理模式。

全新开源模型复现o3视觉推理,无需大量训练即可实现深度思考

量子位
量子位 · 2025-09-15T07:46:06Z

夸克健康大模型成功通过主任医师评测,成为国内首个完成此挑战的大模型,已集成至夸克AI搜索中。该模型具备深度推理能力,吸引了众多医学生和医生使用。

国内首个通过主任医师评测的大模型,已在夸克AI搜索上线

量子位
量子位 · 2025-07-23T08:08:12Z

张丽及其团队在微软亚洲研究院引入“System2”概念,提升大模型的深度推理能力。通过蒙特卡洛搜索算法,7B模型的数学推理能力接近OpenAI的o1,激发了学术界的广泛讨论。她指出智商和推理能力是大模型应用的关键,未来将继续优化奖励模型并扩展任务领域。

她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽

量子位
量子位 · 2025-05-26T04:20:12Z

本研究提出了一种新的奖励建模方法,旨在解决深度推理模型在低资源语言翻译中的不足。与大型推理模型相比,该方法在文学翻译中表现出色,并成功扩展至11种语言,实现了90个翻译方向的优异性能。

ExTrans: Multilingual Deep Reasoning Translation via Exemplar-Enhanced Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z
Qwen 3 基准测试、比较、模型规格及更多信息

Qwen3是阿里巴巴于2025年4月29日发布的开源AI模型,参数规模从600M到32B不等。其混合专家架构实现了高效计算,支持深度推理和快速响应,训练数据涵盖119种语言,适合编程和逻辑问题解决。

Qwen 3 基准测试、比较、模型规格及更多信息

DEV Community
DEV Community · 2025-05-01T14:14:14Z
迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

本文探讨了长链思维在推理大模型中的重要性,分析了其与短链思维的区别,提出了“深度推理、广泛探索、可行反思”三大核心能力,并讨论了推理现象及优化策略,展望未来研究方向。

迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

机器之心
机器之心 · 2025-04-16T05:28:45Z
微软为研究和数据分析新增‘深度推理’Copilot AI

微软为Microsoft 365 Copilot推出了“深度推理”AI工具,包括Researcher和Analyst,旨在进行复杂的多步骤研究和数据分析。Researcher利用OpenAI的深度研究模型,连接第三方数据源,帮助企业客户获取洞察。Analyst能够将原始数据转化为电子表格,并执行Python代码,具备数据科学家的能力。这些新功能预计将在四月开始向用户推出。

微软为研究和数据分析新增‘深度推理’Copilot AI

The Verge
The Verge · 2025-03-26T03:00:48Z

本研究提出了一种新的视觉定位任务——知识密集型视觉定位(KVG),旨在提升多模态大语言模型的视觉推理能力。通过引入DeepPerception模型和自动化数据合成框架,研究表明在KVG-Bench数据集上显著提高了准确率,推动了多模态推理的发展。

DeepPerception: Advancing R1-like Cognitive Visual Perception in Multimodal Large Language Models to Support Knowledge-Intensive Visual Grounding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
首发体验|百度连发两个新模型对标DeepSeek,我让它挑西瓜、卖烧烤,细节全在这了

百度发布了文心大模型4.5和深度思考模型X1,旨在增强AI的多模态和深度推理能力。文心4.5在图像和音频识别方面表现优异,而X1则适合处理复杂任务和多工具调用,展示了百度在AI领域的创新与应用潜力。

首发体验|百度连发两个新模型对标DeepSeek,我让它挑西瓜、卖烧烤,细节全在这了

爱范儿
爱范儿 · 2025-03-16T01:55:20Z

本研究综述了长链思维在大型语言模型推理中的重要性,提出了新的分类法,探讨了深度推理和广泛探索的特征,并明确了未来的研究方向,以促进人工智能逻辑推理的发展。

Towards the Era of Reasoning: An Investigation of Long Chain Thinking in Large Language Model Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-12T00:00:00Z

本研究提出了RetroLM框架,旨在提高大型语言模型在长上下文处理中的效率。该框架通过KV级别检索增强技术,增强了鲁棒性,并在多项基准测试中显著优于现有方法,尤其在深度推理和极长上下文理解任务中表现突出。

Does RAG Really Perform Poorly in Handling Long Contexts?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码