多模态大语言模型基础:大语言模型如何处理文本、图像、音频和视频
ByteByteGo Newsletter
·
VLSU:绘制人工智能安全的联合多模态理解的边界
Apple Machine Learning Research
·
Amazon Nova 多模态嵌入模型实战指南
亚马逊AWS官方博客
·
B站多模态精细画质分析模型在 ICCV2025 大赛获得佳绩
实时互动网
·
MobileCLIP2:改进多模态强化训练
Apple Machine Learning Research
·
UniGen:统一多模态理解与生成的增强训练与测试策略
Apple Machine Learning Research
·
多模态后训练反常识:长思维链SFT和RL的协同困境
机器之心
·