小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
玩转具身智能!文心开源创新大赛AI硬件赛道落幕,看大模型如何“重塑”物理世界

2025年8月19日,文心开源创新大赛启动,吸引900余名开发者参与,聚焦多模态应用与AI+硬件。经过激烈角逐,23支团队晋级决赛,展示了AI与硬件的深度融合,参赛者利用文心4.5模型创新出多种实用硬件解决方案,涵盖健康监测、教育陪伴等领域。大赛推动了AI技术的落地应用,期待未来更多创新成果。

玩转具身智能!文心开源创新大赛AI硬件赛道落幕,看大模型如何“重塑”物理世界

百度大脑
百度大脑 · 2025-12-17T12:06:18Z
告别“纸上谈兵”,这场大赛让AI“跑”在每一块开发板上

文心开源创新大赛于2025年8月19日启动,聚焦多模态应用与AI+硬件,吸引全球900余位开发者参与。赛事展示了70余支优秀团队的创新作品,涵盖智能硬件与AI解决方案,推动技术交流与生态合作,助力开发者成长。赛事旨在激发创新,构建开放共赢的AI生态。

告别“纸上谈兵”,这场大赛让AI“跑”在每一块开发板上

百度大脑
百度大脑 · 2025-11-18T11:10:25Z
文心开源Dev Day|基于此芯P1的文心和飞桨模型部署实战

文心开源创新大赛将于2025年8月19日上线,邀请开发者探索多模态应用和AI+硬件创新方案。活动包括技术工作坊,聚焦AI开发生态,并进行文心大模型和PaddleOCR的实战演示。活动定于11月8日在张江科学之门举行。

文心开源Dev Day|基于此芯P1的文心和飞桨模型部署实战

百度大脑
百度大脑 · 2025-11-03T13:44:35Z
在vLLM上运行NVIDIA Nemotron的多模态推理代理

NVIDIA推出Nemotron Nano 2 VL模型,支持视频理解和文档智能,采用混合Transformer-Mamba架构,具备高效视频采样技术,提升处理效率和准确性,适用于多模态应用。

在vLLM上运行NVIDIA Nemotron的多模态推理代理

vLLM Blog
vLLM Blog · 2025-10-31T00:00:00Z

2025年7月,开放原子大赛在开源生态大会上启动,文心开源创新大赛正式报名,聚焦多模态应用和AI+硬件,鼓励开发者探索创新方案。百度作为合作方,推动开源技术发展,提供教程和线下交流活动,期待优秀作品涌现。

第三届开放原子大赛-文心开源创新大赛正式启动!

百度大脑
百度大脑 · 2025-08-19T13:45:55Z
激战“后DeepSeek时代”:全球大模型开启“地狱级”内卷模式

2024年,国产模型DeepSeek以低成本和高性能冲击AI行业,推动大模型竞争格局变化。价格战、能力提升和多模态应用成为新趋势,国际巨头被迫降价,中国开源生态逐渐掌握定价权,未来市场格局将重塑。

激战“后DeepSeek时代”:全球大模型开启“地狱级”内卷模式

清竹茶馆博客
清竹茶馆博客 · 2025-03-05T02:30:21Z

本研究提出了名为Vieira的声明式框架,旨在解决基础模型的局限性。该框架统一了多种增强机制,将基础模型视为无状态函数,支持复杂的多模态应用。研究表明,Vieira与现代基础模型结合后,准确性与竞争基线相当或更优。

Relational Programming with Foundation Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z
通过Converse API介绍Spring AI与Amazon Bedrock Nova的集成

Spring AI与Amazon Bedrock Nova模型通过Converse API集成,支持多模态应用,包括文本、图像和视频。Nova模型分为Pro、Lite和Micro版本,满足不同需求。该集成简化了开发流程,提供文本补全、图像和视频分析等功能,并支持外部工具调用,助力构建先进的对话应用。

通过Converse API介绍Spring AI与Amazon Bedrock Nova的集成

Spring
Spring · 2024-12-10T00:00:00Z

MedXChat是一个用于医学助理和用户之间互动的模型,包括CXR到报告生成、基于CXR的问答和文本到CXR合成三个功能。该模型在医学多模态应用中表现出优异的适应性,并在MIMIC数据集上超越了基准模型。研究还介绍了一种创新的文本到CXR合成方法,能够生成高保真度的医学图像。研究中的数据和模型将开源。

InMD-X: 内科医生的大型语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-19T00:00:00Z
构建我自己的ChatGPT视觉应用:结合PaLM、KOSMOS-2和LlamaIndex

OpenAI的ChatGPT视觉能力开启了新篇章,开发者们探索视觉理解与对话AI的结合。作者创建了一个多模态原型应用,利用KOSMOS-2进行图像描述,并结合Google的PaLM API实现深度对话。该应用允许用户上传图像并进行实时互动,界面友好,旨在推动视觉语言应用的发展。

构建我自己的ChatGPT视觉应用:结合PaLM、KOSMOS-2和LlamaIndex

Blog on LlamaIndex
Blog on LlamaIndex · 2023-11-08T00:00:00Z

本文介绍了Point-Bind和Point-LLM两个模型,Point-Bind是一个多模态模型,将三维点云与二维图像、语言、音频和视频对齐,实现了许多有前景的应用。Point-LLM是第一个遵循三维多模态指令的三维大型语言模型,通过将Point-Bind的语义注入到预训练的LLM中,实现了出色的三维和多模态问答能力。希望这些模型可以为扩展三维点云到多模态应用的社区提供帮助。

ImageBind-LLM:多模态指令调整

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码