小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
移远通信携多模态智能机器人平台Q-Robotbox参加GEIA Asia 2026

移远通信在上海参加GEIA Asia 2026,展示了其多模态智能机器人平台Q-Robotbox。该平台集成了视觉、听觉和动觉,支持自主移动机器人和智能割草机器人,具备高集成度和低部署门槛。Q-Robotbox依托高性能芯片,实现自然交互,已在多个场景完成算法验证,并正在扩展应用范围。

移远通信携多模态智能机器人平台Q-Robotbox参加GEIA Asia 2026

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-16T07:21:16Z

NotebookLM在2025至2026年间转变为一个多模态创作工作室,支持创意项目的整个生命周期。其五大关键功能包括深度研究引擎、思维导图、视觉工作室、音频和视频概述,以及高容量多模态笔记本。这些功能提升了创意架构师的研究效率、概念可视化、演示文稿生成和复杂决策的结构清晰度。

创意架构师的NotebookLM

KDnuggets
KDnuggets · 2026-04-15T16:00:27Z
Meta亿元天团首个大模型交卷!余家辉宋飏Jason Wei耗时九个月,一雪Llama前耻

Meta推出的新模型Muse Spark经过9个月研发,专注于多模态理解和推理,表现优异,推动股价上涨,标志着Meta重回AI前列。尽管在编程和Agent任务上仍有不足,但整体性能显著提升。

Meta亿元天团首个大模型交卷!余家辉宋飏Jason Wei耗时九个月,一雪Llama前耻

量子位
量子位 · 2026-04-09T01:49:48Z
Meta重新进入人工智能竞赛,推出新模型Muse Spark

Meta推出新AI模型Muse Spark,旨在提升产品智能化,支持多模态输入,处理复杂科学和健康问题。该模型将逐步在WhatsApp、Instagram等平台上线,未来计划开源。

Meta重新进入人工智能竞赛,推出新模型Muse Spark

The Verge
The Verge · 2026-04-08T16:12:54Z
卡帕西没做完的,开源社区48小时搞定了!完全体知识库,token省70倍

开源社区在48小时内推出Graphify工具,自动生成知识图谱,节省71.5倍token消耗。该工具支持多模态处理,用户只需一条命令即可生成交互式知识图谱,降低使用门槛。

卡帕西没做完的,开源社区48小时搞定了!完全体知识库,token省70倍

量子位
量子位 · 2026-04-07T05:50:13Z
OpenClaw v2026.4.5更新:原生视频生成,看起来非常稳定!

OpenClaw v2026.4.5更新引入视频和音乐生成功能,增强多模态能力,支持多语言界面,优化工作流和审批系统,提升记忆处理和性能稳定性,简化配置管理,推动AI应用可控化发展。

OpenClaw v2026.4.5更新:原生视频生成,看起来非常稳定!

极道
极道 · 2026-04-06T06:37:00Z
GPT-6,曝光了

OpenAI计划于4月14日发布GPT-6,该模型性能提升40%,支持多模态处理,具备200万Token的上下文窗口。OpenAI将重心放在GPT-6上,目标是实现AGI。同时,GPT-Image 2也备受关注,展现出更强的生成能力。算力成为AI竞争的关键因素。

GPT-6,曝光了

量子位
量子位 · 2026-04-05T04:49:33Z
美团盯上原生多模态!路子还很野:把图像语音都当成Token来预测

美团LongCat提出的DiNA原生多模态架构将图像、语音和文本统一为离散Token,突破了传统模型的局限。该模型通过共享参数和机制,实现了更高效的理解与生成,推动了多模态AI的发展。

美团盯上原生多模态!路子还很野:把图像语音都当成Token来预测

量子位
量子位 · 2026-04-03T06:24:01Z

Google于4月2日发布了开源模型Gemma 4,强调参数效率和本地运行能力,支持多种设备和语言,具备多模态处理能力,适用于Agent工作流开发。该模型采用Apache 2.0许可证,兼容主流工具链,推动AI在移动端和边缘计算的应用。

派早报:Google 发布 Gemma 4 开源系列模型、智谱发布 GLM-5V-Turbo 多模态模型等

少数派
少数派 · 2026-04-03T00:39:38Z

智谱推出的GLM-5V-Turbo是首个多模态编码基础模型,支持视频、图片和文本输入,优化AI工作流程,具备实时响应和工具调用能力。

智谱推出GLM-5V-Turbo多模态编码基础模型 支持输入图像/视频/文本等

蓝点网
蓝点网 · 2026-04-02T03:38:23Z
7/24 Office:一个能自修复、自写工具、自我进化的智能体

一名程序员利用纯Python和少量工具,开发出一个自我进化的AI代理系统,具备自修复、自动编写工具和多模态处理能力,能够24小时运行,支持定时任务和多用户管理。

7/24 Office:一个能自修复、自写工具、自我进化的智能体

极道
极道 · 2026-03-31T00:25:00Z
美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

LongCat团队推出了新AI模型LongCat-Next,旨在统一处理图像、声音和文本等多模态信息。通过离散原生自回归架构DiNA和视觉分词器dNaViT,该模型实现了不同模态的统一建模,增强了理解与生成的协同能力。研究表明,离散化能更好地理解物理世界,且不损失信息。该模型已开源,欢迎开发者参与。

美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

实时互动网
实时互动网 · 2026-03-27T02:56:42Z
精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

北京大学彭宇新团队提出了分类感知表征对齐方法TARA,旨在解决多模态大模型在生物类别分层识别中的挑战,提升细粒度和分层视觉识别的准确率。该方法通过对齐大模型与生物基础模型的表征,注入类别树知识,从而增强模型的识别能力。

精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

量子位
量子位 · 2026-03-21T09:48:18Z
全网猜了一周 DeepSeek V4,结果是小米干的

小米发布了三款新模型:Hunter Alpha、Healer Alpha 和 MiMo-V2 系列,旨在提升 AI 任务执行能力。Hunter Alpha 和 Healer Alpha 为内测版本,MiMo-V2-Pro 专注推理与规划,MiMo-V2-Omni 实现多模态感知,MiMo-V2-TTS 提供自然语音表达。这些模型将推动小米的智能生态战略。

全网猜了一周 DeepSeek V4,结果是小米干的

爱范儿
爱范儿 · 2026-03-19T08:12:42Z
2026奇点智能技术大会将于4月在上海举办

2026奇点智能技术大会将于4月17-18日在上海举行,聚焦多模态和AI基础设施等12个前沿主题,分享实战经验,推动行业发展。

2026奇点智能技术大会将于4月在上海举办

全球TMT-美通国际
全球TMT-美通国际 · 2026-03-19T02:16:06Z
小米神操作!认领榜一神秘模型Hunter Alpha,龙虾之父都忍不住打听

小米发布了万亿参数的旗舰模型MiMo-V2-Pro,取代Hunter Alpha,表现优异,支持长文本和复杂任务,全球智能指数排名第八,代码能力超越Claude 4.6。同时,MiMo-V2-Omni和TTS模型也具备强大的多模态处理能力。

小米神操作!认领榜一神秘模型Hunter Alpha,龙虾之父都忍不住打听

量子位
量子位 · 2026-03-19T01:18:29Z

本文介绍了如何使用vLLM进行离线推理,生成多模态嵌入,并展示了符合HuggingFace模型库规范的文本和图像提示格式。

【vLLM 学习】Vision Language Embedding

HyperAI超神经
HyperAI超神经 · 2026-03-18T09:00:03Z
「不作秀」的科沃斯机器人,如何实现具身智能未来?

AI的发展正从大模型转向与现实世界的连接。科沃斯推出的陪伴机器人“毛团儿”具备多模态感知能力,能够自然互动,满足情感需求。未来,家庭机器人将由工具转变为智能伙伴,提升生活质量。

「不作秀」的科沃斯机器人,如何实现具身智能未来?

爱范儿
爱范儿 · 2026-03-16T09:30:22Z

谷歌于3月11日发布了Gemini Embedding 2模型,这是首个支持文本、图像和视频等多模态输入的嵌入模型,能够识别100种语言的语义意图,简化数据处理并增强应用能力。该模型已通过Gemini API和Vertex AI提供预览。

派早报:Google 发布 Gemini Embedding 2 模型等

少数派
少数派 · 2026-03-12T00:41:44Z
让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

谷歌推出Gemini Embedding 2,这是首个原生多模态嵌入模型,能够将文本、图像、视频、音频和文档映射到同一语义空间,提升AI Agent对现实世界的理解,为多模态应用奠定基础。

让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

量子位
量子位 · 2026-03-11T09:30:54Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码