百川-全能技术报告

📝

内容提要

本研究解决了现有开放源代码多模态大型语言模型的不足,提出了百川-全能,这是首个能够同时处理图像、视频、音频和文本的7B多模态大型语言模型。通过引入多模态训练方案,研究展示了该模型在多种多模态基准测试中的强大表现,旨在为开放源代码社区提供竞争性基线,推动多模态理解和实时交互的发展。

🏷️

标签

➡️

继续阅读