小红花·文摘

玩转具身智能！文心开源创新大赛AI硬件赛道落幕，看大模型如何“重塑”物理世界

百度大脑 ·

告别“纸上谈兵”，这场大赛让AI“跑”在每一块开发板上

百度大脑 ·

文心开源Dev Day｜基于此芯P1的文心和飞桨模型部署实战

百度大脑 ·

在vLLM上运行NVIDIA Nemotron的多模态推理代理

vLLM Blog ·

2025年7月，开放原子大赛在开源生态大会上启动，文心开源创新大赛正式报名，聚焦多模态应用和AI+硬件，鼓励开发者探索创新方案。百度作为合作方，推动开源技术发展，提供教程和线下交流活动，期待优秀作品涌现。

第三届开放原子大赛-文心开源创新大赛正式启动！

百度大脑 ·

激战“后DeepSeek时代”：全球大模型开启“地狱级”内卷模式

清竹茶馆博客 ·

本研究提出了名为Vieira的声明式框架，旨在解决基础模型的局限性。该框架统一了多种增强机制，将基础模型视为无状态函数，支持复杂的多模态应用。研究表明，Vieira与现代基础模型结合后，准确性与竞争基线相当或更优。

Relational Programming with Foundation Models

BriefGPT - AI 论文速递 ·

通过Converse API介绍Spring AI与Amazon Bedrock Nova的集成

Spring ·

MedXChat是一个用于医学助理和用户之间互动的模型，包括CXR到报告生成、基于CXR的问答和文本到CXR合成三个功能。该模型在医学多模态应用中表现出优异的适应性，并在MIMIC数据集上超越了基准模型。研究还介绍了一种创新的文本到CXR合成方法，能够生成高保真度的医学图像。研究中的数据和模型将开源。

InMD-X: 内科医生的大型语言模型

BriefGPT - AI 论文速递 ·

构建我自己的ChatGPT视觉应用：结合PaLM、KOSMOS-2和LlamaIndex

Blog on LlamaIndex ·

本文介绍了Point-Bind和Point-LLM两个模型，Point-Bind是一个多模态模型，将三维点云与二维图像、语言、音频和视频对齐，实现了许多有前景的应用。Point-LLM是第一个遵循三维多模态指令的三维大型语言模型，通过将Point-Bind的语义注入到预训练的LLM中，实现了出色的三维和多模态问答能力。希望这些模型可以为扩展三维点云到多模态应用的社区提供帮助。

ImageBind-LLM：多模态指令调整

BriefGPT - AI 论文速递 ·