小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
一文通透Qwen3-VL——在交错式MRoPE、DeepStack、文本时间戳对齐机制的基础上,先预训练,再后训练(即分别SFT、蒸馏、RL)

Qwen系列模型最新升级为Qwen3-VL,在视觉理解和视频处理方面有显著提升。引入多维旋转位置编码(MRoPE)和DeepStack技术,增强了对复杂场景的推理能力,支持长文档和长视频处理,具备更高的上下文长度和精确的时间定位能力,推动多模态理解的进步。

一文通透Qwen3-VL——在交错式MRoPE、DeepStack、文本时间戳对齐机制的基础上,先预训练,再后训练(即分别SFT、蒸馏、RL)

结构之法 算法之道
结构之法 算法之道 · 2026-05-08T07:57:45Z
月之暗面最强模型 Kimi-K2.6 正式开源 —— 附 vLLM 部署实战

Kimi-K2.6是Moonshot AI于4月20日发布的开源大语言模型,具备长上下文推理和多模态理解能力。文章介绍了模型的下载、部署及性能基准测试,强调其在多项评测中的优异表现。Kimi-K2.6支持工具调用和视觉-语言输入,适合多种应用场景。

月之暗面最强模型 Kimi-K2.6 正式开源 —— 附 vLLM 部署实战

探索云原生
探索云原生 · 2026-04-22T20:00:00Z
中国最强编程模型来了! 阿里Qwen3.6-Plus性能直逼Claude,国产大模型杀入决赛圈

阿里发布了Qwen3.6-Plus编程模型,性能接近Claude,具备强大的编程和智能体能力。该模型支持Vibe Coding和多模态理解,能够快速生成复杂网页和交互场景,显著降低编程门槛。在真实评测中表现优异,超越许多主流模型,未来将推出更多版本。

中国最强编程模型来了! 阿里Qwen3.6-Plus性能直逼Claude,国产大模型杀入决赛圈

量子位
量子位 · 2026-04-02T07:08:18Z
Mistral AI 发布 Mistral Small 4:一款拥有 1190 亿参数的 MoE 模型

Mistral AI 发布了 Mistral Small 4,具备指令执行、推理和多模态理解功能,支持256k上下文窗口,具有可配置推理强度,提升了推理效率和经济性,适合通用聊天和复杂推理。

Mistral AI 发布 Mistral Small 4:一款拥有 1190 亿参数的 MoE 模型

实时互动网
实时互动网 · 2026-03-17T02:21:52Z
12篇成果入选CVPR 2026!百度实现视觉与多模态技术多点突破

百度在CVPR 2026会议上成功入选12篇论文,涉及多模态理解、人脸识别和自动驾驶等领域,展示了其技术实力与创新能力。此次会议吸引了全球顶尖投稿,录用率为25.42%。

12篇成果入选CVPR 2026!百度实现视觉与多模态技术多点突破

百度大脑
百度大脑 · 2026-02-25T11:15:50Z

谷歌发布Gemini 3.1 Pro,推理性能是3 Pro的两倍,支持复杂任务生成3D可视化内容。该模型在多模态理解和长上下文方面有显著提升,用户反馈良好,定价与前代相同,智能成本持续下降,推动大模型发展。

谷歌突发Gemini 3.1 Pro!首次采用「.1」版本号,推理性能×2的那种

量子位
量子位 · 2026-02-20T01:25:54Z

豆包大模型2.0正式发布,经过21个月的更新,提升了多模态理解、企业级Agent和推理能力。在数学和视觉推理基准上取得业界最高分,支持复杂任务和编程,展现出更强的工具调用能力,适合企业应用。

整整21个月,豆包大模型正式进入2.0时代!

量子位
量子位 · 2026-02-14T08:41:53Z

Gemini 3 Flash是一个升级版AI,具备博士级推理能力和多模态理解,能够快速回答和解决复杂问题。

Gemini 3 Flash 登陆 Gemini 应用

The Keyword
The Keyword · 2025-12-17T16:00:00Z

商汤科技的SenseNova-SI模型在空间智能领域超越了李飞飞团队的Cambrian-S,标志着AI技术的转变。林达华指出,未来AI应从语言模型转向多模态理解,以更好地理解物理世界。商汤通过原生多模态架构NEO,实现了数据效率提升和空间智能的突破,推动了AI的实际应用。

大模型的进化方向:Words to Worlds | 对话商汤林达华

量子位
量子位 · 2025-12-17T15:17:15Z
飞桨星河社区月度报告(2025年11月)

本月动态更新包括Arena模型竞技场的开放,支持多轮对话评测和大模型对比;Playground新增ERNIE-5.0模型,提升多模态理解能力;Notebook新增高性能BI-150S机器。社区项目涵盖金融、健康等领域,推出多项AI应用。数据集资源新增103个,支持多任务评测。重点活动包括ESP32应用开发实战和Hackathon赛事,鼓励开发者创新。

飞桨星河社区月度报告(2025年11月)

百度大脑
百度大脑 · 2025-12-12T14:29:47Z
终于发布的Gemini 3,什么是它真正的王牌?

Gemini 3发布,增强推理和多模态理解,已整合至Google搜索和应用中,提升用户体验。新IDE Antigravity展示AI协作能力,推动多模态应用发展,改变行业竞争格局。

终于发布的Gemini 3,什么是它真正的王牌?

爱范儿
爱范儿 · 2025-12-01T12:51:15Z
Nano Banana Pro保姆级指南!全网最火玩法+官方7大技巧+免费渠道,都在这了

Nano Banana Pro是一款强大的AI工具,支持生成信息图和连环画,提升文本渲染和多模态理解能力。用户可通过简单提示词创建复杂视觉效果。尽管功能强大,但需注意数据准确性和生成效果的局限性。

Nano Banana Pro保姆级指南!全网最火玩法+官方7大技巧+免费渠道,都在这了

爱范儿
爱范儿 · 2025-11-23T01:52:00Z

谷歌Gemini 3 Pro在各项测试中超越GPT-5.1,展现出卓越的编程和长期规划能力。新平台Google Antigravity简化了开发流程,支持多种模型,吸引了开发者参与。Gemini系列持续进化,具备更强的多模态理解和人机交互能力。

谷歌Gemini 3把GPT-5.1打成计量单位!马斯克奥特曼都服了

量子位
量子位 · 2025-11-19T01:41:40Z
Gemini 3 Pro现已在JetBrains IDE中上线

谷歌最新的AI模型Gemini 3 Pro已在JetBrains IDE上线,能够理解代码库、适应开发者风格、精确执行指令,并在前端开发中表现优异。该模型与Junie合作,将草图转化为功能完整的网页,展示了强大的多模态理解能力。

Gemini 3 Pro现已在JetBrains IDE中上线

The JetBrains Blog
The JetBrains Blog · 2025-11-18T16:12:47Z

Gemini 3 Pro是最新的智能模型,能够将创意转化为现实,表现出色,支持复杂编码和多模态理解。开发者可通过Google AI Studio和Vertex AI使用该模型,提高开发效率,简化软件开发流程。

开始使用Gemini 3构建

The Keyword
The Keyword · 2025-11-18T16:00:00Z

谷歌推出了Gemini 3,这是其最新的智能模型,具备先进的推理和多模态理解能力。该模型已在搜索中上线,能够更好地理解用户意图,并提供动态视觉布局和互动工具,帮助用户解决复杂问题。谷歌将在未来几周内进一步优化搜索中的自动模型选择,以提升用户体验。

搭载Gemini 3的谷歌搜索:我们迄今为止最智能的搜索

The Keyword
The Keyword · 2025-11-18T16:00:00Z
南财学子携百度AI亮相中亚论坛——“AI+教育创新”中国方案引发国际关注!

在哈萨克斯坦的国际论坛上,南京财经大学学生团队展示了基于百度ERNIE技术的AI智能评估系统。该系统将商业计划书的生成时间从几天缩短至5分钟,并通过多模态理解技术提升文档解析能力。未来,团队计划推出多语言版本和教育可视化分析模块,推动AI在国际教育中的应用。

南财学子携百度AI亮相中亚论坛——“AI+教育创新”中国方案引发国际关注!

百度大脑
百度大脑 · 2025-10-31T11:57:53Z
智谱推出 GLM Coding Plan 企业版:以最强 Agentic Coding 赋能千行百业

智谱推出GLM Coding Plan企业版,基于GLM-4.6模型,提供安全、高效、低成本的智能编程解决方案,助力企业智能化转型。该产品支持多模态理解和联网搜索,具备高用量、低成本、高性能和高安全性,适配多种编程工具,满足企业开发需求。

智谱推出 GLM Coding Plan 企业版:以最强 Agentic Coding 赋能千行百业

实时互动网
实时互动网 · 2025-10-21T02:52:15Z

李飞飞指出,大语言模型在理解物理世界方面存在局限,因其主要依赖一维语言信号,而物理世界是三维的。尽管模型能处理语言任务,但在空间智能和物理推理上表现不佳,无法真正理解物理现象。这引发了对模型结合物理与多模态理解的讨论。

李飞飞一年前究竟说了啥?怎么又火了

量子位
量子位 · 2025-09-11T06:32:39Z
向量搜索已到达极限,接下来会发生什么

向量数据库是现代AI系统的基础,但在检索增强生成应用中面临挑战,如缺乏全文搜索、结构化数据支持不足、排名灵活性差、外部推理延迟及实时更新困难。这些限制影响个性化和多模态理解,传统向量搜索无法满足企业级AI应用需求。

向量搜索已到达极限,接下来会发生什么

The New Stack
The New Stack · 2025-08-08T15:00:23Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码