Hugging Face - Blog ·

介绍IDEFICS：开源的先进视觉语言模型

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

IDEFICS是基于Flamingo的开放访问视觉语言模型，接受图像和文本输入并生成文本输出。有两个变体，参数分别为90亿和800亿。模型在公开可用的数据集和名为OBELICS的新数据集上进行了训练。模型的架构、训练方法和评估详见模型卡和研究论文。模型进行了偏见评估，并为项目制定了道德宪章。模型可在Hugging Face Hub上获取。

🎯

关键要点

IDEFICS是基于Flamingo的开放访问视觉语言模型，接受图像和文本输入并生成文本输出。
模型有两个变体，参数分别为90亿和800亿。
IDEFICS旨在提供与大型专有模型相匹配的能力，促进AI系统的透明性。
模型训练使用公开可用的数据集，包括维基百科和新创建的OBELICS数据集。
OBELICS数据集包含141百万个交错的图像-文本文档和353百万张图像。
项目开始时制定了道德宪章，强调自我批评、透明性和公平性。
模型经过内部评估以识别潜在偏见，采用对抗性提示的方式进行评估。
IDEFICS模型可在Hugging Face Hub上获取，并支持最新的transformers版本。

🏷️

介绍IDEFICS：开源的先进视觉语言模型

内容提要

关键要点

标签

继续阅读