💡 原文中文,约5300字,阅读约需13分钟。
📝

内容提要

B站多媒体实验室在ICCV MIPI Workshop的细粒度图像质量定位国际挑战赛中,提出多模态训练策略,提升综合指标13.5%,获得第二名。实验室专注于视频质量评价与图像处理的协同,应用GRPO算法优化模型,验证了SFT+GRPO的有效性,推动智能视频处理系统的发展。

🎯

关键要点

  • B站多媒体实验室在ICCV MIPI Workshop的细粒度图像质量定位国际挑战赛中获得第二名。
  • 提出多模态训练策略,综合指标提升13.5%。
  • 实验室专注于视频质量评价与图像处理的协同,推动智能视频处理系统的发展。
  • BILIVQA 2.0视频质量评价算法于2023年秋上线,致力于实现全链路系统。
  • 研究通过多模态大语言模型进行细粒度视频画质分析。
  • GRPO算法被应用于视频画质及内容分析,提升模型预测准确率。
  • 比赛中采用数据压缩和困难样本挖掘技术,快速提升MLLM在benchmark上的表现。
  • 最终模型在dev榜登顶,final榜获得第二名,验证了SFT+GRPO联合优化策略的有效性。
  • 未来计划搭建“内容与失真分析-视频图像处理-优化效果评估”的全链路系统。
  • B站多媒体实验室致力于多媒体技术能力的提升,提供高质量的多媒体解决方案。
➡️

继续阅读