内容提要
B站多媒体实验室在ICCV MIPI Workshop的细粒度图像质量定位国际挑战赛中,提出多模态训练策略,提升综合指标13.5%,获得第二名。实验室专注于视频质量评价与图像处理的协同,应用GRPO算法优化模型,验证了SFT+GRPO的有效性,推动智能视频处理系统的发展。
关键要点
-
B站多媒体实验室在ICCV MIPI Workshop的细粒度图像质量定位国际挑战赛中获得第二名。
-
提出多模态训练策略,综合指标提升13.5%。
-
实验室专注于视频质量评价与图像处理的协同,推动智能视频处理系统的发展。
-
BILIVQA 2.0视频质量评价算法于2023年秋上线,致力于实现全链路系统。
-
研究通过多模态大语言模型进行细粒度视频画质分析。
-
GRPO算法被应用于视频画质及内容分析,提升模型预测准确率。
-
比赛中采用数据压缩和困难样本挖掘技术,快速提升MLLM在benchmark上的表现。
-
最终模型在dev榜登顶,final榜获得第二名,验证了SFT+GRPO联合优化策略的有效性。
-
未来计划搭建“内容与失真分析-视频图像处理-优化效果评估”的全链路系统。
-
B站多媒体实验室致力于多媒体技术能力的提升,提供高质量的多媒体解决方案。
延伸问答
B站多媒体实验室在ICCV2025大赛中获得了什么成绩?
B站多媒体实验室在ICCV MIPI Workshop的细粒度图像质量定位国际挑战赛中获得了第二名。
B站提出了什么样的训练策略来提升图像质量评估?
B站提出了多模态训练策略,综合指标提升了13.5%。
GRPO算法在视频质量分析中有什么作用?
GRPO算法被应用于视频画质及内容分析,提升模型预测准确率。
BILIVQA 2.0算法的上线时间是什么时候?
BILIVQA 2.0视频质量评价算法于2023年秋上线。
B站未来在视频处理系统方面有什么计划?
未来计划搭建“内容与失真分析-视频图像处理-优化效果评估”的全链路系统。
比赛中使用了哪些技术来提升模型表现?
比赛中采用了数据压缩和困难样本挖掘技术,快速提升MLLM在benchmark上的表现。