苹果开源多模态AI模型4M-21
原文英文,约600词,阅读约需2分钟。发表于: 。Researchers at Apple and the Swiss Federal Institute of Technology Lausanne (EPFL) have open-sourced 4M-21, a single any-to-any AI model that can handle 21 input and output modalities. 4M-21...
苹果和瑞士洛桑联邦理工学院的研究人员开源了4M-21,这是一个可以处理21种输入和输出模态的单一任意到任意的AI模型。该模型基于Transformer,具有30亿参数,并在多个视觉基准测试中表现出色。它可以执行可控的图像生成和图像检索等任务。新模型扩大了模态数量,包括文本和像素数据。