小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
移远通信携多模态智能机器人平台Q-Robotbox参加GEIA Asia 2026

移远通信在上海参加GEIA Asia 2026,展示了其多模态智能机器人平台Q-Robotbox。该平台集成了视觉、听觉和动觉,支持自主移动机器人和智能割草机器人,具备高集成度和低部署门槛。Q-Robotbox依托高性能芯片,实现自然交互,已在多个场景完成算法验证,并正在扩展应用范围。

移远通信携多模态智能机器人平台Q-Robotbox参加GEIA Asia 2026

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-16T07:21:16Z

NotebookLM在2025至2026年间转变为一个多模态创作工作室,支持创意项目的整个生命周期。其五大关键功能包括深度研究引擎、思维导图、视觉工作室、音频和视频概述,以及高容量多模态笔记本。这些功能提升了创意架构师的研究效率、概念可视化、演示文稿生成和复杂决策的结构清晰度。

创意架构师的NotebookLM

KDnuggets
KDnuggets · 2026-04-15T16:00:27Z
Meta亿元天团首个大模型交卷!余家辉宋飏Jason Wei耗时九个月,一雪Llama前耻

Meta推出的新模型Muse Spark经过9个月研发,专注于多模态理解和推理,表现优异,推动股价上涨,标志着Meta重回AI前列。尽管在编程和Agent任务上仍有不足,但整体性能显著提升。

Meta亿元天团首个大模型交卷!余家辉宋飏Jason Wei耗时九个月,一雪Llama前耻

量子位
量子位 · 2026-04-09T01:49:48Z
Meta重新进入人工智能竞赛,推出新模型Muse Spark

Meta推出新AI模型Muse Spark,旨在提升产品智能化,支持多模态输入,处理复杂科学和健康问题。该模型将逐步在WhatsApp、Instagram等平台上线,未来计划开源。

Meta重新进入人工智能竞赛,推出新模型Muse Spark

The Verge
The Verge · 2026-04-08T16:12:54Z
卡帕西没做完的,开源社区48小时搞定了!完全体知识库,token省70倍

开源社区在48小时内推出Graphify工具,自动生成知识图谱,节省71.5倍token消耗。该工具支持多模态处理,用户只需一条命令即可生成交互式知识图谱,降低使用门槛。

卡帕西没做完的,开源社区48小时搞定了!完全体知识库,token省70倍

量子位
量子位 · 2026-04-07T05:50:13Z
OpenClaw v2026.4.5更新:原生视频生成,看起来非常稳定!

OpenClaw v2026.4.5更新引入视频和音乐生成功能,增强多模态能力,支持多语言界面,优化工作流和审批系统,提升记忆处理和性能稳定性,简化配置管理,推动AI应用可控化发展。

OpenClaw v2026.4.5更新:原生视频生成,看起来非常稳定!

极道
极道 · 2026-04-06T06:37:00Z
GPT-6,曝光了

OpenAI计划于4月14日发布GPT-6,该模型性能提升40%,支持多模态处理,具备200万Token的上下文窗口。OpenAI将重心放在GPT-6上,目标是实现AGI。同时,GPT-Image 2也备受关注,展现出更强的生成能力。算力成为AI竞争的关键因素。

GPT-6,曝光了

量子位
量子位 · 2026-04-05T04:49:33Z
美团盯上原生多模态!路子还很野:把图像语音都当成Token来预测

美团LongCat提出的DiNA原生多模态架构将图像、语音和文本统一为离散Token,突破了传统模型的局限。该模型通过共享参数和机制,实现了更高效的理解与生成,推动了多模态AI的发展。

美团盯上原生多模态!路子还很野:把图像语音都当成Token来预测

量子位
量子位 · 2026-04-03T06:24:01Z

Google于4月2日发布了开源模型Gemma 4,强调参数效率和本地运行能力,支持多种设备和语言,具备多模态处理能力,适用于Agent工作流开发。该模型采用Apache 2.0许可证,兼容主流工具链,推动AI在移动端和边缘计算的应用。

派早报:Google 发布 Gemma 4 开源系列模型、智谱发布 GLM-5V-Turbo 多模态模型等

少数派
少数派 · 2026-04-03T00:39:38Z

智谱推出的GLM-5V-Turbo是首个多模态编码基础模型,支持视频、图片和文本输入,优化AI工作流程,具备实时响应和工具调用能力。

智谱推出GLM-5V-Turbo多模态编码基础模型 支持输入图像/视频/文本等

蓝点网
蓝点网 · 2026-04-02T03:38:23Z
7/24 Office:一个能自修复、自写工具、自我进化的智能体

一名程序员利用纯Python和少量工具,开发出一个自我进化的AI代理系统,具备自修复、自动编写工具和多模态处理能力,能够24小时运行,支持定时任务和多用户管理。

7/24 Office:一个能自修复、自写工具、自我进化的智能体

极道
极道 · 2026-03-31T00:25:00Z
美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

LongCat团队推出了新AI模型LongCat-Next,旨在统一处理图像、声音和文本等多模态信息。通过离散原生自回归架构DiNA和视觉分词器dNaViT,该模型实现了不同模态的统一建模,增强了理解与生成的协同能力。研究表明,离散化能更好地理解物理世界,且不损失信息。该模型已开源,欢迎开发者参与。

美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

实时互动网
实时互动网 · 2026-03-27T02:56:42Z
精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

北京大学彭宇新团队提出了分类感知表征对齐方法TARA,旨在解决多模态大模型在生物类别分层识别中的挑战,提升细粒度和分层视觉识别的准确率。该方法通过对齐大模型与生物基础模型的表征,注入类别树知识,从而增强模型的识别能力。

精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

量子位
量子位 · 2026-03-21T09:48:18Z
全网猜了一周 DeepSeek V4,结果是小米干的

小米发布了三款新模型:Hunter Alpha、Healer Alpha 和 MiMo-V2 系列,旨在提升 AI 任务执行能力。Hunter Alpha 和 Healer Alpha 为内测版本,MiMo-V2-Pro 专注推理与规划,MiMo-V2-Omni 实现多模态感知,MiMo-V2-TTS 提供自然语音表达。这些模型将推动小米的智能生态战略。

全网猜了一周 DeepSeek V4,结果是小米干的

爱范儿
爱范儿 · 2026-03-19T08:12:42Z
2026奇点智能技术大会将于4月在上海举办

2026奇点智能技术大会将于4月17-18日在上海举行,聚焦多模态和AI基础设施等12个前沿主题,分享实战经验,推动行业发展。

2026奇点智能技术大会将于4月在上海举办

全球TMT-美通国际
全球TMT-美通国际 · 2026-03-19T02:16:06Z
小米神操作!认领榜一神秘模型Hunter Alpha,龙虾之父都忍不住打听

小米发布了万亿参数的旗舰模型MiMo-V2-Pro,取代Hunter Alpha,表现优异,支持长文本和复杂任务,全球智能指数排名第八,代码能力超越Claude 4.6。同时,MiMo-V2-Omni和TTS模型也具备强大的多模态处理能力。

小米神操作!认领榜一神秘模型Hunter Alpha,龙虾之父都忍不住打听

量子位
量子位 · 2026-03-19T01:18:29Z

本文介绍了如何使用vLLM进行离线推理,生成多模态嵌入,并展示了符合HuggingFace模型库规范的文本和图像提示格式。

【vLLM 学习】Vision Language Embedding

HyperAI超神经
HyperAI超神经 · 2026-03-18T09:00:03Z
「不作秀」的科沃斯机器人,如何实现具身智能未来?

AI的发展正从大模型转向与现实世界的连接。科沃斯推出的陪伴机器人“毛团儿”具备多模态感知能力,能够自然互动,满足情感需求。未来,家庭机器人将由工具转变为智能伙伴,提升生活质量。

「不作秀」的科沃斯机器人,如何实现具身智能未来?

爱范儿
爱范儿 · 2026-03-16T09:30:22Z

谷歌于3月11日发布了Gemini Embedding 2模型,这是首个支持文本、图像和视频等多模态输入的嵌入模型,能够识别100种语言的语义意图,简化数据处理并增强应用能力。该模型已通过Gemini API和Vertex AI提供预览。

派早报:Google 发布 Gemini Embedding 2 模型等

少数派
少数派 · 2026-03-12T00:41:44Z
让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

谷歌推出Gemini Embedding 2,这是首个原生多模态嵌入模型,能够将文本、图像、视频、音频和文档映射到同一语义空间,提升AI Agent对现实世界的理解,为多模态应用奠定基础。

让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

量子位
量子位 · 2026-03-11T09:30:54Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码