B站多模态精细画质分析模型在 ICCV2025 大赛获得佳绩

B站多模态精细画质分析模型在 ICCV2025 大赛获得佳绩

💡 原文中文,约5300字,阅读约需13分钟。
📝

内容提要

B站多媒体实验室在ICCV MIPI Workshop的细粒度图像质量定位国际挑战赛中,提出多模态训练策略,提升综合指标13.5%,获得第二名。实验室专注于视频质量评价与图像处理的协同,应用GRPO算法优化模型,验证了SFT+GRPO的有效性,推动智能视频处理系统的发展。

🎯

关键要点

  • B站多媒体实验室在ICCV MIPI Workshop的细粒度图像质量定位国际挑战赛中获得第二名。

  • 提出多模态训练策略,综合指标提升13.5%。

  • 实验室专注于视频质量评价与图像处理的协同,推动智能视频处理系统的发展。

  • BILIVQA 2.0视频质量评价算法于2023年秋上线,致力于实现全链路系统。

  • 研究通过多模态大语言模型进行细粒度视频画质分析。

  • GRPO算法被应用于视频画质及内容分析,提升模型预测准确率。

  • 比赛中采用数据压缩和困难样本挖掘技术,快速提升MLLM在benchmark上的表现。

  • 最终模型在dev榜登顶,final榜获得第二名,验证了SFT+GRPO联合优化策略的有效性。

  • 未来计划搭建“内容与失真分析-视频图像处理-优化效果评估”的全链路系统。

  • B站多媒体实验室致力于多媒体技术能力的提升,提供高质量的多媒体解决方案。

延伸问答

B站多媒体实验室在ICCV2025大赛中获得了什么成绩?

B站多媒体实验室在ICCV MIPI Workshop的细粒度图像质量定位国际挑战赛中获得了第二名。

B站提出了什么样的训练策略来提升图像质量评估?

B站提出了多模态训练策略,综合指标提升了13.5%。

GRPO算法在视频质量分析中有什么作用?

GRPO算法被应用于视频画质及内容分析,提升模型预测准确率。

BILIVQA 2.0算法的上线时间是什么时候?

BILIVQA 2.0视频质量评价算法于2023年秋上线。

B站未来在视频处理系统方面有什么计划?

未来计划搭建“内容与失真分析-视频图像处理-优化效果评估”的全链路系统。

比赛中使用了哪些技术来提升模型表现?

比赛中采用了数据压缩和困难样本挖掘技术,快速提升MLLM在benchmark上的表现。

➡️

继续阅读