小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
C# OnnxRuntime 部署 DAViD 深度估计

本文介绍了一个深度估计模型的实现,使用Microsoft.ML.OnnxRuntime和OpenCvSharp库。用户可以选择图片进行深度推理,程序处理图像并生成深度彩色图,支持保存结果。详细说明了模型路径和输入输出张量的设置。

C# OnnxRuntime 部署 DAViD 深度估计

dotNET跨平台
dotNET跨平台 · 2026-04-20T23:57:27Z
Mythos架构被22岁小伙“逆推”开源了!MoE和注意力借鉴DeepSeek

OpenMythos是一种新型的循环深度Transformer架构,采用MoE路由机制,通过跨专家权重共享实现高效推理。在参数量减少近一半的情况下,其性能与传统模型相当。研究表明,循环Transformer在处理未见知识组合和深度推理方面表现更佳,可能改变大模型的训练方式,受到学术界关注。

Mythos架构被22岁小伙“逆推”开源了!MoE和注意力借鉴DeepSeek

量子位
量子位 · 2026-04-20T07:59:51Z
MiroFlow:面向深度研究任务的高性能开源智能体框架

MiroFlow是一个高性能的开源智能体框架,旨在克服大型语言模型在复杂任务中的局限性。它通过智能体图、深度推理模式和健壮工作流,提升智能体的自主性和性能,适合深度研究任务,推动AI智能体的发展。

MiroFlow:面向深度研究任务的高性能开源智能体框架

Micropaper
Micropaper · 2026-03-01T10:00:00Z

字节Seed通过化学思想重新定义AI长链思维,提出深度推理、自我反思和自我探索三种思维行为,形成稳定的推理结构。这些行为在推理过程中相互作用,提升模型的逻辑聚焦和思维覆盖,进而提高推理效率。

字节Seed用化学思想搞AI,把DeepSeek-R1的脑回路拆成了分子结构

量子位
量子位 · 2026-02-24T07:23:05Z
Kimi K2思维:我国思维模型的真正觉醒

中国的大语言模型正从“聊天模型”转向“思维模型”。Moonshot AI的Kimi K2思维模型实现了“深度推理、长上下文和工具调用连续性”的统一,标志着中国进入思维模型时代。K2强调推理能力,具备稳定的工具调用、深层推理链和256k上下文,推动中国模型与国际接轨。

Kimi K2思维:我国思维模型的真正觉醒

云原生
云原生 · 2025-11-14T08:25:26Z
Moonshot AI的Kimi K2思维模型现已在Vercel AI Gateway上提供

Moonshot AI推出Kimi K2思维和Kimi K2思维Turbo模型,支持深度推理和快速响应。用户可通过Vercel的AI Gateway无须额外账户访问,享受统一API和性能优化。

Moonshot AI的Kimi K2思维模型现已在Vercel AI Gateway上提供

Vercel News
Vercel News · 2025-11-06T13:00:00Z

生成式推荐(GRs)在过去一年取得显著进展,依托大型语言模型(LLM)提升推荐性能,形成新范式。传统推荐面临特征工程和模型复杂度的瓶颈,而LLM通过长序列建模和知识注入有效解决冷启动问题。未来,GRs将重点关注深度推理、多模态对齐和并行生成优化,重构推荐系统的价值链。

探索无限可能:生成式推荐的演进、前沿与挑战【AI业务应用方向】

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-10-20T08:21:48Z
探索无限可能:生成式推荐的演进、前沿与挑战【AI业务应用方向】

生成式推荐(GRs)在过去一年取得显著进展,利用大型语言模型(LLM)提升推荐性能,形成新范式。传统推荐面临特征工程和模型复杂度的瓶颈,而LLM通过长序列建模和知识注入解决冷启动问题。未来,GRs将专注于深度推理、多模态对齐和并行生成优化,重构推荐系统的价值链,推动智能化发展。

探索无限可能:生成式推荐的演进、前沿与挑战【AI业务应用方向】

京东科技开发者
京东科技开发者 · 2025-10-20T08:16:45Z
同样是 Sonnet 4.5,为何 CLI 工具差距这么大

Claude Code CLI 和 Copilot CLI 都基于 Claude Sonnet 4.5 模型,但性能差异明显。Claude Code 支持 200K tokens 的上下文和扩展思维,适合复杂任务,而 Copilot CLI 仅支持 8K tokens,缺乏深度推理,导致在复杂任务中表现不佳,容易遗忘信息。

同样是 Sonnet 4.5,为何 CLI 工具差距这么大

技术小黑屋
技术小黑屋 · 2025-10-13T00:00:00Z

Mini-o3是字节与港大联合开发的开源视觉推理模型,支持多轮深度推理,突破传统模型限制。通过冷启动微调和强化学习,Mini-o3在视觉搜索任务中表现优异,显著超越现有模型,提供多样化推理模式。

全新开源模型复现o3视觉推理,无需大量训练即可实现深度思考

量子位
量子位 · 2025-09-15T07:46:06Z

夸克健康大模型成功通过主任医师评测,成为国内首个完成此挑战的大模型,已集成至夸克AI搜索中。该模型具备深度推理能力,吸引了众多医学生和医生使用。

国内首个通过主任医师评测的大模型,已在夸克AI搜索上线

量子位
量子位 · 2025-07-23T08:08:12Z

张丽及其团队在微软亚洲研究院引入“System2”概念,提升大模型的深度推理能力。通过蒙特卡洛搜索算法,7B模型的数学推理能力接近OpenAI的o1,激发了学术界的广泛讨论。她指出智商和推理能力是大模型应用的关键,未来将继续优化奖励模型并扩展任务领域。

她如何把“系统2”带给了大模型 |对话微软亚洲研究院张丽

量子位
量子位 · 2025-05-26T04:20:12Z

本研究提出了一种新的奖励建模方法,旨在解决深度推理模型在低资源语言翻译中的不足。与大型推理模型相比,该方法在文学翻译中表现出色,并成功扩展至11种语言,实现了90个翻译方向的优异性能。

ExTrans: Multilingual Deep Reasoning Translation via Exemplar-Enhanced Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z
Qwen 3 基准测试、比较、模型规格及更多信息

Qwen3是阿里巴巴于2025年4月29日发布的开源AI模型,参数规模从600M到32B不等。其混合专家架构实现了高效计算,支持深度推理和快速响应,训练数据涵盖119种语言,适合编程和逻辑问题解决。

Qwen 3 基准测试、比较、模型规格及更多信息

DEV Community
DEV Community · 2025-05-01T14:14:14Z
迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

本文探讨了长链思维在推理大模型中的重要性,分析了其与短链思维的区别,提出了“深度推理、广泛探索、可行反思”三大核心能力,并讨论了推理现象及优化策略,展望未来研究方向。

迈向推理时代:900+篇参考文献揭示长链思维的前世今生,最全综述来了

机器之心
机器之心 · 2025-04-16T05:28:45Z
微软为研究和数据分析新增‘深度推理’Copilot AI

微软为Microsoft 365 Copilot推出了“深度推理”AI工具,包括Researcher和Analyst,旨在进行复杂的多步骤研究和数据分析。Researcher利用OpenAI的深度研究模型,连接第三方数据源,帮助企业客户获取洞察。Analyst能够将原始数据转化为电子表格,并执行Python代码,具备数据科学家的能力。这些新功能预计将在四月开始向用户推出。

微软为研究和数据分析新增‘深度推理’Copilot AI

The Verge
The Verge · 2025-03-26T03:00:48Z

本研究提出了一种新的视觉定位任务——知识密集型视觉定位(KVG),旨在提升多模态大语言模型的视觉推理能力。通过引入DeepPerception模型和自动化数据合成框架,研究表明在KVG-Bench数据集上显著提高了准确率,推动了多模态推理的发展。

DeepPerception: Advancing R1-like Cognitive Visual Perception in Multimodal Large Language Models to Support Knowledge-Intensive Visual Grounding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z
首发体验|百度连发两个新模型对标DeepSeek,我让它挑西瓜、卖烧烤,细节全在这了

百度发布了文心大模型4.5和深度思考模型X1,旨在增强AI的多模态和深度推理能力。文心4.5在图像和音频识别方面表现优异,而X1则适合处理复杂任务和多工具调用,展示了百度在AI领域的创新与应用潜力。

首发体验|百度连发两个新模型对标DeepSeek,我让它挑西瓜、卖烧烤,细节全在这了

爱范儿
爱范儿 · 2025-03-16T01:55:20Z

本研究综述了长链思维在大型语言模型推理中的重要性,提出了新的分类法,探讨了深度推理和广泛探索的特征,并明确了未来的研究方向,以促进人工智能逻辑推理的发展。

Towards the Era of Reasoning: An Investigation of Long Chain Thinking in Large Language Model Inference

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-12T00:00:00Z

本研究提出了RetroLM框架,旨在提高大型语言模型在长上下文处理中的效率。该框架通过KV级别检索增强技术,增强了鲁棒性,并在多项基准测试中显著优于现有方法,尤其在深度推理和极长上下文理解任务中表现突出。

Does RAG Really Perform Poorly in Handling Long Contexts?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码