最近的研究关注生成式多模态大型语言模型(MLLMs),通过引入SEED-Bench基准测试解决了MLLMs生成理解评估问题。该基准测试包含19K个准确的多项选择问题,涵盖了12个评估维度,包括图像和视频模态的理解。希望SEED-Bench为未来的研究提供见解。
完成下面两步后,将自动完成登录并继续当前操作。