VLSU:绘制人工智能安全的多模态联合理解的界限
Apple Machine Learning Research
·
视觉语言安全理解(VLSU):联合多模态理解的局限性映射
Apple Machine Learning Research
·
Video-LLaMA:用于视频理解的指令调优音频-视觉语言模型
DEV Community
·